9月25日消息,據國外媒體報道,你是如何在網上尋找視頻的?輸入一些關鍵詞。但問題在于,視頻不是由字詞組成,它們是移動影像,或者說移動影像和聲音的集合。
為了改進在線視頻搜索,有的公司正致力于開發不僅能夠尋找嵌入式關鍵字標簽、還能夠自動分析圖像和聲音的系統,以便找到更加相關的視頻。Dextro正是當中的一員。該公司的聯合創始人大衛·盧安(David Luan)表示,“這讓我們更接近于使得網絡視頻變得可容易搜索和發現,這意味著要在元標簽以外做功夫,要真正理解視頻的內容。”
他稱該系統為“Site, Sound, and Motion”,具體的演示可在Dextro官方網站上查看。總的來說,它讓你可以在人們發布到Twitter的視頻當中搜索出你想要的內容。例如,搜索有關美國地產大亨唐納德 特朗普(Donald Trump)的視頻,會調出直接定位到提及特朗普之處的視頻,比如Lady Gaga被問到她是否是特朗普的支持者的時候。
該工具并不是面向消費者的服務,但盧安和Dextro將會給有意在自有應用和網站上提供視頻搜索工具的企業機構提供該項技術。Dextro已經在提供類似的服務:今年早些時候,它展示了一項尋找Periscope(Twitter的實時視頻點播工具)流媒體視頻的工具。而新工具的與之的差別在于,它既分析聲音,也分析圖像。
“我們既處理視頻中的聲音,又處理當中的圖像。”盧安說道,“通過結合處理它們來分析出視頻的內容。”
該工具是時下廣泛興起的人工智能運動的一部分,不少公司組織都在利用名為深度學習的人工智能技術來自動識別圖像和聲音,甚至理解自然語言。借助深度學習技術,大型機器網絡(被稱為神經網絡)通過分析海量的數據來學習執行任務。Dextro的系統是通過分析大量的視頻來進行學習。
不過,它還使用其它的技術來辨認視頻中的聲音。它不僅僅可以識別語音,一定程度上還能夠連接語音背后的意思。“我們在嘗試從視頻中提取出最有意思的概念和話題。”盧安說。不過他拒絕透露詳情。但要點在于,該系統不只是分析聲音,不只是分析圖像,而是同時分析二者來盡可能多地提取視頻的含義。