Sirius,這家名字酷似Siri的公司,正做著和Siri類似的事情——個人語音助手。不同的是,這項完全開源的項目,背后的大Boss是Google、ARM、美國國防高級研究計劃局(DARPA) 、美國國家科學基金會(National Science Foundation)。
近期,在國際編程語言和操作系統架構支持大會(the International Conference on Architectural Support for Programming Languages and Operating Systems)上,密歇根大學的研究人員展示了開源語音助手項目Sirius。
Sirius運用深度學習技術,通過海量數據訓練和學習,可以提供個人語音助手的核心功能,比如語音識別、圖片匹配、自然語言處理和問答系統。但相比于Siri,Sirius更像是個“野孩子”,它是由多個開源項目組合而成的。比如語音方面,Sirius就結合了卡內基梅隆大學的Sphinx項目和Caffe平臺的技術;圖像識別方面,使用了SURF技術和IBM Watson也在使用的圖像數據庫;問答系統則使用了卡內基梅隆大學的OpenEphyra。
目前,這個項目已經被放在了GitHub上,任何個人和組織都可以下載、使用它。但目前只能在烏班圖系統的桌面上測試,不過相信不久之后就會出現在更多的設備上。
此前,也有人做過開源的語音助手項目,比如GitHub上的JuliusJs,不過這一項目最終沒有成功,8個月前已經停止了更新。加上蘋果、Google、微軟等大公司都勢在必得,這些小項目成功的幾率其實也很小。有Google、ARM和DARPA背書,Sirius能笑到最后么?