Google里有遠見的領導者已經向其計算機里注入了他們的愿景。
為了支撐其已經引人矚目的圖像和物體識別領域的領導地位,搜索巨頭并購了法國創業公司Moodstocks,該公司擅長于智能手機里的基于機器學習的圖像識別技術。
“我們的夢想是將攝像頭調優成智能傳感器來賦予機器眼睛,讓它們能夠感知周圍的環境,” Moodstocks在其聲明中這么說。
Google收購Moodstocks是其“人才并購”中的最新手筆,這樣的并購涉及基于機器學習的圖像識別,這是計算機視覺領域的核心組件。Amazon在今年初收購Orbeus、Twitter幾周前收購了Magic Pony Technology,這起收購發生在這之后,這反映出了業界觀察家們所描述的科技領導者間的競爭,他們都在嘗試加速商業化下一個計算機相關的前沿領域。
“科技公司已經投資了大量時間和金錢來理解互聯網文本,”Forrester Research的首席分析師Mike Gualtieri在一封郵件里寫到。“他們現在想要理解圖像,這十分自然。通過文字和圖像的組合意思所能夠提供出的AI,不僅僅能夠理解文字(語音),而且能夠進行圖像識別。”
比如,Google已經傳聞在開發能夠讓用戶僅僅用圖像作為搜索詞,直接從照片里進行搜索的功能。Google希望能夠利用Moodstocks的人才力量——他們將會加入Google位于巴黎的現有的研究和開發團隊,來幫助進一步推進計算視覺領域的研究。
“我們已經在視覺識別方面有了很大的成功,” Vincent Simonet寫到,他是Google法國研究和開發中心的老大,“但是該領域還有很多事情需要完成。”
大數據引領圖像識別的新紀元Google Photos——以及Facebook,Flickr和其他處理圖像分類和標記的公司,已經在后臺采用了先進的圖像識別技術,但是“這些方案還能夠更快,更高效,并且要求更少的訓練資源,” Tomasz Malisiewicz博士也同意這一點,他是Magic Leap Inc.深度學習領域的首席軟件工程師,這是一家位于佛羅里達州的致力于增強現實技術的創業公司。
“在圖像識別的全新的深度學習時代里,計算視覺團隊的整個概念都在被重構,” Malisiewicz說。“當算法開發還依靠人工的時候,擁有強大的博士團隊來引導開發是十分重要的。但是隨著深度學習軟件的商業化,大部分開發人員都能夠使用今年最流行的神經網絡架構來訓練識別模型。”
這個新時代的圖像識別領域里至關重要的就是數據——大量數據。
“關注點已經從算法設計本身轉移到大規模數據管理上,因為性能最好的模型要求海量的數據,” Malisiewicz說。
重構視覺世界對于公司而言,除了海量數據之外,這里面還有些什么?分析師指出,基于機器學習的圖像識別用例不僅僅是簡單的分類,比如找到個人家庭照片或者在購物分類里縮小產品類型。
該技術擁有變革醫療行業的可能性,比如,通過醫療圖像幫助醫生診斷疾病。另外,增強和虛擬現實的可穿戴設備需要使用攝像頭來感知周圍的世界,能夠受益于圖像識別和改進的跟蹤功能,Malisiewicz說。
基于機器學習的圖像識別能夠幫助企業自動化運維功能,比如監控,實地檢測以及其他任何涉及持續或者周期性檢查的事情,Forrester的Gualtieri說。
計算視覺領域的進步所帶來的可操作數據開啟了企業盈利的新機遇,Matthew Zeiler這么認為,他是Clarifai的創始人和CEO,這是一家擅長于視覺識別的AI公司。
“他們還能夠從之前未標記的信息源里收集信息,這些信息源是沒有任何描述,元數據或者標簽的圖像和視頻,”他補充道。
還會帶來一些其他的好處。計算視覺仍然是相對新的領域,積極探索很重要,密歇根大學電子工程和計算機科學的副教授Jason Corso博士說。
“很重要的一點是,要注意到這些進步和商業案例很少涉及可能的市場和問題。我們的世界是視覺世界;對于未來的先進技術而言,利用這個世界的豐富性是非常重要的,”他說。