最近幾年,科幻電影不斷推陳出新,展現了未來眾多可能的情景,而它們在電影中提出如何運用科技的方式,也給硬件創業者諸多想象。從湯姆·漢克斯的《少數派報告》,到小羅伯特·唐尼的《鋼鐵俠 3》,再到斯嘉麗·約翰遜的《Her》,你會發現語音交互的比例越來越高。
《少數派報告》的場景雖然科幻,然而需要人不斷抬起手滑動來滑動去的方式,其實很累;《鋼鐵俠 3》中,鋼鐵俠主要用語音來下命令,而用手勢進行細微的操作;至于《Her》,語音占據交互的整體部分,手機則是用于展示圖片、視頻,用于定位和拍照。
最近我接觸不少硬件創業者,相當有趣的是,他們對語音的興趣越來越高。經過了解則發現,他們的觀點是這樣的:在交互上,越不花費人精力的方式,會越好。所以比起手勢,會更加看好聲音在交互上的作用,畢竟語音交互只需要人動動嘴皮子而已。
但是,若讓創業團隊自己從頭做一個語音識別功能,費錢費力不說,效果是不是達到預期也是未知數。MIT Technology Review 最近報道了國外一個創業項目 Wit.ai,則是希望能夠為硬件創業者提供一個語音命令的框架,讓后者的產品當中,輕易集成語音控制的功能。
公司創始人 Alex Lebrun 此前創立另外一家公司叫 VirtuOz,為 eBay 和 AT&T 開發類似 Siri 一樣的聲控軟件。因此有相關的技術背景。
Wit.ai 稱開發者只需要 3 步,即可把語音識別功能集成到產品里。第一步,上傳設定自己需要的語音命令,第二部,調用 Wit.ai 的 API,輸入音頻得到結果,第三步,讓 WIt.ai 進行學習,并改進識別精度。——換言之,語音會發送到 Wit.ai 的服務器,然后服務器向應用返回結構化的數據。
對于 Wit.ai 來說,其實做到語音識別不難,但難在如何讓各個平臺的開發者,都能利用到 Wit.ai 的 API 接口。實際上,Wit.ai 做了不少準備,查看開發文檔可知道,它已經兼容 Web、iOS、Android、Node.js、Raspberry Pi、Ruby、Python、C 和 Rust 等不同的版本。
滑鐵盧大學的學生 Nick Mostowich 上個月參加了校內黑客馬拉松,他以及團隊成員利用 Wit.ai 為他智能微波爐產品添加語音控制功能。他說,他們很快就添加了一系列和食譜有關的指令,這樣用戶在說“給我做點培根”,然后微波爐就會啟動,然后設定好合適的火力和時間。
在國內,科大訊飛 8 月份發布了面向智能家居領域的語音產品,但主要合作方是傳統電視廠商創維、長虹、海信、TCL、康佳、海爾、邁樂機頂盒等。