微軟面向更廣泛的開發者們發布了25項Cognitive Services(認知服務)工具中的3個。
微軟的Cognitive Services應用編程接口(API)讓開發者可以向他們的應用中增加像語音識別、語言理解、情緒檢測這樣的一些功能。
Cognitive Services和機器人都是微軟人工智能、以及更為具體的“交談即平臺”戰略的一個組成部分。微軟Cognitive Services API旨在與微軟Bot Framework很好地協同工作,這在機器人場景中是很有用的。(還可以獨立與機器人場景使用)與微軟的Cognitive Services一樣,機器人可以是基于語音、語言和視覺的。
微軟正在重新命名Custom Speech Service(也就是此前私人預覽的CRIS)并提供公開預覽。Custom Speech Service工具采用了微軟的語音轉文本引擎,該引擎主要針對開發者提供的數據。
過去十年微軟一直在對自己的語音識別算法進行調優,使其能夠在有行話、對話和口音的嘈雜環境下使用。Custom Speech Service采用了這篇博客文章中描述的這些算法。
微軟還將在2017年3月提供Content Moderator和Bing Speech API。Content Moderator讓用戶可以在發布圖片、文字和視頻之前對這些信息進行隔離和審查。Bing Speech API則可以把音頻轉換為文本,再把文本轉換為語音。
微軟方面表示,目前已經有60個國家的超過424000個開發者嘗試了不同的微軟Cognitive Services服務。