3月24日消息,據科技博客TechCrunch報道,谷歌計劃向第三方開發者開放其語音識別API,與Nuance及其它的語音識別公司競爭。為了吸引開發者,該API一開始將免費提供。
有關該服務的消息已經傳了好幾周。該公司今天在NEXT云用戶大會上正式公布了該項服務。
谷歌表示,谷歌云語音API(Google Cloud Speech API)將覆蓋超過80種語言,兼容任何實時串流或者批處理模式的應用,它將為應用程序提供一整套API,給它們帶來“看、聽與翻譯”方面的功能。它基于目前驅動谷歌應用的語音搜索和谷歌鍵盤的語音輸入的神經網絡技術。它還有一些其它有趣的功能,如可在嘈雜的環境運行,支持實時運行。
谷歌的這一舉措將會對整個行業產生不小的影響——尤其是對Nuance。長期以來,Nuance一直被認為是業界最好的語音識別技術提供商,它也是該領域最大的一家公司。鑒于谷歌提供的體驗比現有提供商要好,而且定價較低,包括創業公司在內的眾多Nuance客戶有可能會轉投谷歌技術的懷抱。
為了引起開發者的興趣,谷歌的語音識別API一開始將完全免費提供。未來它將要收費,但價格很可能會比較低。谷歌可能會在成為該行業的主導者之后再上調服務價格。
截至目前為止,谷歌在其產品中提供的語音技術訪問權限十分有限。該公司在去年的I/O大會上發布了一款語音交互API,讓Android開發者可以為他們的應用加入語音交互功能。不過,谷歌尚未直接開放它的語音識別API。
而語音識別API的推出,將不僅僅影響到Nuance和其它的語音識別技術提供商,也將會對蘋果造成沖擊。蘋果虛擬助手Siri的語音識別功能并不如谷歌的。蘋果目前也沒有通過提供API讓開發者在他們的應用中使用Siri技術。
種種跡象顯示,谷歌似乎變得更加注重語音技術和眾多的使用案例。例如,該公司在2月宣布將允許Google Docs用戶通過語音來編輯和設計文檔。