微軟一直在緊鑼密鼓地將游戲和Azure服務推至物聯網(IOT)設備上。但很少有業界人士注意到,微軟同時也在將各種語音功能推至物聯網設備。
今年2月,在臺北舉辦的中國WinHEC研討會上碰巧聽了微軟的一個名為“用于物聯網的自然用戶界面技術”的演講,演講介紹了微軟在物聯網語音領域采用的多管齊下策略,目標聽眾是開發商。
微軟為物聯網開發商提供各種整合工具,以用于語音和開發商設備的整合:Windows 10有內置的語音應用程序編程接口(API),可完成各種功能,如口述一個簡單的消息和網頁搜索;微軟還提供自然語言服務,全名為語言理解智能服務(縮寫為LUIS),LUIS是微軟研究院牛津API集合的一部分,可用于非Windows平臺。另外,微軟還提供Bing翻譯、Cortana及微軟個人數字助理等工具。
要搞清楚哪個工具是完成某個功能的最佳工具貌似頗為微妙。微軟官員在WinHEC研討會上提供了一個指導框架,框架列出了一些的應用實例,例如如何通過語音控制法式烹飪機(用到LUIS與Windows 10的組合或牛津語音API)或如何用語音控制機器人(用到Windows 10自帶語音API)。
微軟還展示了一個家庭自動化設備控制的例子,舉例說明了用戶如何無需使用手機或平板電腦、只利用語音查詢自己的車庫門是不是關閉妥當。
微軟在2016年中國WinHEC會上的演講,還為物聯網開發商提供了利用牛津API進行人臉檢測、識別和驗證的一些指引。
另外,微軟可能會在今年的Build大會上宣布牛津項目(Project Oxford)將結束研究階段進入商業化之路。微軟可能會將牛津項目的一些服務貼上新的Azure認知服務牌子或Azure的智能服務牌子。