昨天在36氪上看到了一篇《深圳札記:為什么我們認為小米做智能家居的思路是錯的》,內容非常有趣,文中關于小米模式是否能夠在智能家居市場成功的討論,讓筆者發現原有自己非常想討論這個話題:智能家居的未來是什么呢?
當筆者開始想一些未來發展話題時,就會想起2007年D5峰會上喬布斯與蓋茨關于5年后智能設備發展的對話。當時莫博士詢問兩人五年后他們會使用怎樣的便攜設備,喬布斯說是iPhone,蓋茨說是平板設備。站在2014年看,似乎是喬布斯贏了,不過筆者認為蓋茨也會勝利。
2007年,那時喬布斯剛剛發布iPhone,微軟第一次公布了Surface這個名稱,雖然那時只是針對企業用的桌面電腦解決方案(有點像如今在微軟各個公司擺著的PixelSense),不過那時的蓋茨就在布道他關于智能設備的遠見。他所說的平板設備不僅僅是如今擺在人們眼前的Surface RT或者Pro。而是一系列的應用場景的集合。 蓋茨原話如是:“我認為未來你不僅擁有一個設備,我認為你走到哪都會有個全屏設備(Full Screen),她會有語音功能,某種意義的鍵盤……她可以放進口袋,但你回家,她會是一個至少60寸的大屏幕,你可以看電影玩游戲,這些都會跟互聯網相連,而你在臥室或辦公室會有類似的設備出現……我的觀點是每一個水平或垂直表面,都會有一個投影儀,你能把信息放上去。你的桌子會成為一個操作界面……”
看到了嗎?這就是蓋茨眼里的未來智能生活,也許在2012年微軟沒有實現這些,但是致力于做物聯網樞紐的Windows10似乎正在努力做到這些事:這個世界上任何一個屏幕,都會成為你的操作界面,比如一款可穿戴設備,或者是物聯網下的智能桌子。特別是微軟為Xbox360帶來了Kinect后,似乎有了這么一個關于智能家居的定義——讓家居第一次看到使用者,并為其服務。
在中國,智能家居的制造者現在大體上分兩派。 以小米為首的中心派,小米主推“智能家庭”概念,從Wifi路由器為中心變為以智能插座為入口,谷歌大概也屬于這個行列,他們都在行業里進行激進的并購。這些互聯網巨頭認為未來智能家居將以一件家具或一個系統為中心。
另一派則是標準派,以深圳硬件廠商為首,他們認為智能家居間需要有通信標準,比如ZigBee,需要有無線充電標準,也需要有統一的人機交互標準,比如利用深度攝像頭的體感操作以及語音識別。筆者更傾向于標準派,不過略有不同。 筆者認為未來十年甚至數十年,智能家居將努力去中心化,就像蓋茨當初預言一樣,未來的世界你將擁有多個設備,無數個操作界面,為你提供統一的服務。這時你用來完成互聯網搜索或者智能服務的設備,將不僅是一臺電腦或者iPhone,很可能是一個桌子或者一臺冰箱。
在這樣的未來,一個極力充當服務中心的恒溫器或者智能插座似乎有點違和了。就像消費者不會刻意去購買一個萬能遙控器,大多數廠商也不會屈服于生產一個中心設備的附屬品。專注生產洗衣機的廠商,會生產性能更好更方便的智能洗衣機,這臺洗衣機將能自動識別衣物、自動分類清洗,專注生產空調的廠商,也會生產會更具恒溫性能的中央空調,某種程度上這樣的產品才會大量被普及。這些智能家居唯一的共性,也許是他們能夠具備更好的計算能力,她們都連結到互聯網上,他們都能“看到”和“聽到”使用者,并“理解”使用者的意圖。
筆者不認為小米或者谷歌就徹底錯了,未來是很難預料的,即便是這些頂級公司,他們也認為在智能家居領域要快速試錯,各類嘗試我想他們都會去做。谷歌的立足點是美國家庭都習慣于使用恒溫器,而中國家庭不可或缺的就是插座。這些商業洞察都對,只是讓他們變成智能家居的中心,看起來非常難。試想一下吧,也許上一刻,你還開著特斯拉在回家路上,通過特斯拉向你家里的智能空調發去了開機的命令,下一刻你回到家,就在用手機來讓智能空調調試至舒適的溫度。
人們選擇所謂智能家居或者智能設備追求的是方便,是易用性。就像阿里巴巴徹底改變了交易的場景一樣,智能家居承擔的一大功能點,就是改變所謂的服務場景。以前只能在某個場景下做的事情,在其他場景下也能用了。阿里讓人們在任何地方都能買賣東西,那么智能家居很大程度上,也要完成類似的任務。
讓人可以在任何人,在任何場景下,用任何方式都能享受到智能化服務,或許是智能家居一個可見的未來。要實現這樣一個去中心化,任意場景下的標準化服務,或許需要更多的圖形圖像技術和語音識別技術,比如NLP(語義識別)和行為監測。筆者的創業公司就是致力于利用深度攝像頭,比如Kinect,來提供健康服務。未來或許所有帶上這類攝像頭的智能家居都會被我們植入相關的軟件,通過對使用者的行為監測,來提供服務。
那么未來的智能家居里,會不會出現接近“中心”的產品呢?一個超級智能手表?筆者認為家庭機器人或許會成為一類特別重要的智能家居。家庭機器人不會是智能家居的中心,而是未來家庭的新成員。這是筆者認為智能家居承擔的第二大功能點——擬人。
哆啦A夢、星球大戰里的C-3PO和R2-D2,還是機器人總動員里的瓦力和伊娃?這些不再是科幻,而會變為可見的現實,家庭機器人就是下一個“克拉克軌道”。這些機器人也許會遵循阿西莫夫的機器人三定律。 事實上,利用圖形圖像和仿生學的機器人、機械臂早被利用在工業上,比如筆者因工作關系多次接觸的德國圖形圖像老牌廠商LMI,相關技術早就發展了幾十年,他們的圖形圖像技術被應用在各類工業機器人中,比如富士康用來組裝產品的超級機械臂。
現在,這個世界上有大大小小不少硬件廠商正在將這些工業技術轉為民用,他們正在努力為他們的客戶們提供新的家庭成員。 有一位叫Kevin Ochs的極客值得關注,他不是機器人領域的專家,也不是智能家居業的創業者,他是Dreamworks的Character Technical Director Supervisor。在夢工廠待了12年,曾參與制作功夫熊貓和馴龍記等知名3D動畫。這個充滿幻想的超級極客有一個愛好——蛛型機器人(spiderlike octopod robot)。
下面這段視頻可以看到Kevin Ochs在這方面的工作。 他從去年11月份開始研發的一款名叫Charlotte機器人,采用了Raspberry Pi以及Xiton Live Pro的結構。這里的Xiton是由Pimesense授權,ASUS生產的一種深度攝像頭,可以說與微軟的Kinect1師出同門。深度攝像頭在這里最大的意義,就是相比普通攝像頭,加大了識別立體物體的效率。這也是蓋茨在那次D5峰會上所言的愿景之一,筆者會在最后做個簡短介紹。而Raspberry Pi則是大家非常熟悉的樹莓派,小型化廉價化的開源電腦代表。從這樣一個結合可以讓你看到這么一個信號:機器人技術已經開源化、廉價化以及民用化。
Charlotte在仿生學技術上使用的是Nuke,在這個領域實際有大量還不為大眾所知的技術,但隨著技術大量的開源,未來會逐漸走入平常百姓家,筆者在未來的文章里也會做相關介紹。由于搭載了Xiton,可以檢測到外界的物體避免碰撞,擁有自然人際交互語音模塊,在新的版本中通過wifi將機器人和Google Translate s Voice 連接。機器人就可以通過語音來反饋信息,當發現威脅或者入侵者的時候機器人可以用語音進行警告。視頻中的機器人就通過語音報告找到了碰撞源。
不僅如此,還是因為有Xiton這個深度攝像頭,該機器人可以對碰撞源進行識別,如果能計算出骨骼信息,可以合理推測該物體是人類。因此這款機器人就擁有了能夠在特定空間中搜索人類的能力,由于它的運動結構采用的是觸肢式而非輪式,理論上擁有了全空間特征,可以在崎嶇不平的表面運動。規避了一些家庭擁有樓梯/臺階/室內不平坦造成機器人無法通過或者卡住的問題。
想象下未來的家庭,你將擁有這樣一個可以進行行為監測和語音交互的全地形機器人。你可以讓她幫你看護小孩和老人,你可以讓她幫你遛狗,當像筆者這樣的公司為她寫入健康服務類軟件之后,她就可以全天候監測你以及你家人的健康了。 蓋茨家的微軟,就正在籌劃著為自家的機器人放入微軟小冰或Cortana,他們在IROS2014 chicago直接推出了可編程并配備了深度攝像頭的機器人。當蘋果將PrimeSense這家深度攝像頭核心芯片廠收購后,你可以很合理的猜測蘋果下一步公布的智能家居中將會讓Siri與深度攝像頭結合。 有相似想法的超級公司已經帶來了他們的產品。海爾帶來了他們的機器人ECAN,主要是面向幼兒教育,可以追蹤幼兒,識別使用者行為,并投射影像。
ECAN也是一臺可編程的機器人,海爾在機器人領域積累了15年,這是他們第一次將工業機器人技術上的積累轉為民用。海爾預計ECAN將在今年11月上市,并且已經內置了第三方的應用。 在Kickstarter上眾籌的機器人Keecker,就是蓋茨在D5峰會上預言的先行者。這臺機器人擁有深度攝像頭以及投影設備,Keecker的愿景就是成為公用電腦——她會跟著使用者,在任意平面投射一個操作界面,供所有人去工作、學習和娛樂。 另一個眾籌的機器人JIBO則更為有趣,開發者將其定義為“保姆”。
JIBO能夠識別影像和聲音,她能夠很好的識別出不同的家庭成員,為不同的家庭成員提供服務,比如日程管理。最關鍵的是,JIBO能夠識別使用者的語音、肢體和表現的意義,并予以記錄和反饋。 JIBO的腦袋是個屏幕,當使用者微笑的時候,屏幕里也會出現一個微笑的符號,讓使用者有種使用聊天工具跟人互動的錯覺。 能夠完成這些功能,得益于JIBO的核心部件—— 包括兩個彩色立體相機、全身傳感器(比如聲音識別)、5.7英寸高清液晶觸屏、揚聲器、ARM移動處理器和嵌入式Linux平臺。利用攝像頭和聲音識別,JIBO不僅能夠快速進行身份識別,還能進行動作捕捉以及識別情緒,最重要的是JIBO能夠通過Wifi和藍牙連入互聯網,將一切捕捉到的信息放到云端進行處理。 在一個讓智能家居看到主人的未來世界,蓋茨關于任何地方都是操作界面的遠見似乎會取得了勝利。一個能夠跟你互動的家庭機器人,一個在任意場景下都能讓你操作的智能設備,是不是比一個智能插座好玩多了呢? 在那次D5峰會的最后,蓋茨談到了一個當年非常流行的話題——什么時候3D應用到(操作系統的)人機交互上(When 3D comes into that interface)。
蓋茨的原話是這樣的: “如今虛擬世界的圖像繪制技術取得了突破,電腦的世界里可以大量采用3D圖形了。你可以在一個虛擬的書店里,讓圖書像真實世界里一樣擺放。特別是當我們逐漸能夠讓計算機獲得更多的多媒體信息時,計算機就成了一個服務中樞。”
當莫博士問到多點觸摸會不會讓未來世界像少數派報告里那樣時,蓋茨直接跳到了更遠的未來: “這是視頻識別,這是3D定位設備,我們有這樣的設備了……未來攝像頭將無處不在,當然我們必須處理好隱私問題。不過當計算機可以廉價的處理視覺信息的時候,就意味著這類設備(攝像頭)會非常普遍。我們說的可不僅是便攜設備,還會是在會議室或者是臥室。當計算機不僅能夠獲得大量來自虛擬世界的信息,還有來自真實世界的信息,兩者信息的對等,將會帶來人機交互的革命,一種好的技術演化。”
蓋茨口中的3D定位設備就是后來的Kinect,也許你從ECAN、Keecker或是JIBO看到深度攝像頭的威力。這是筆者在致力于做的事情——新一代的人機交互。就像觸屏所帶來的革命一樣,深度攝像頭也將帶來一次革命。這不僅將發生在智能家居或是機器人領域,而是各個技術可及的地方。 就像蓋茨說的,攝像頭在未來將無處不在。好了,筆者似乎找到了下一篇文章的話題,屆時將為各位分析現今深度攝像頭領域的發展趨勢,你會發現如今在推動智能手機發展的超級公司,早已在這個領域打得不可開交。其中就包括小米、微軟和蘋果……