據(jù)外媒報道,對于谷歌(微博)來說,識別圖片中的對象已不再是挑戰(zhàn)。它的下一個挑戰(zhàn)就是識別和搜索視頻中的內(nèi)容,因為視頻的數(shù)據(jù)量比圖片更大,更難概括和識別。
不單是谷歌,社交網(wǎng)絡Facebook、閱后即焚應用Snap和微博網(wǎng)站Twitter也都在努力識別視頻內(nèi)容。
但是,很久以來,谷歌旗下的視頻網(wǎng)站YouTube就一直被稱作是全球第二大的搜索引擎,僅次于谷歌搜索引擎。雖然文字搜索請求可以幫助谷歌返回YouTube視頻搜索結(jié)果,但是真正的視頻內(nèi)容搜索技術(shù)尚未得到應用。
數(shù)月前,谷歌給科學研究領域獻上了一份大禮:YouTube-8M 視頻數(shù)據(jù)集。在今天,谷歌又更新了這個數(shù)據(jù)集。這也許并非巧合。開放數(shù)據(jù),特別是斯坦福ImageNet數(shù)據(jù)庫和微軟COCO數(shù)據(jù)庫,推動著圖片識別搜索的研究。人工智能系統(tǒng)需要數(shù)據(jù)才能變得更為智能。這些組織已在致力于提供這樣的原始數(shù)據(jù)。
當然,谷歌并非只想著打造先進技術(shù),造福全人類。它也希望借此改善自己的產(chǎn)品,就像它在Gmail郵箱系統(tǒng)中引入Smart Replies智能回復功能以及在Google Translate翻譯服務中添加“實時視覺翻譯”功能一樣。谷歌當然希望YouTube能夠成為人們搜索視頻的最佳去處。
“如果它能夠識別奶牛跳過月球或貓兒跳過籬笆的視頻,那就太酷了。”谷歌高級研究員杰夫·迪恩(Jeff Dean)在谷歌首次舉辦的TensorFlow Dev Summit峰會上說。
迪恩稱,這意味著谷歌不再需要依靠描述和評論等元數(shù)據(jù)來進行搜索了。這種視頻搜索技術(shù)還可以改善視頻推薦服務。
現(xiàn)在,我們尚不清楚YouTube何時會推出這種視頻搜索功能。
迪恩稱,一般來說,“視頻搜索可能要落后圖片搜索好幾年。”