今天早晨,谷歌推出了開源工具TensorFlow,打算把人工智能相關的知識和經驗向大眾分享。按照谷歌披露的信息,TensorFlow是一種機器學習系統,從智能手機到大型數據中心服務器都能使用。
但問題是,從搜索到智能手機上的圖片識別,再到幾乎可以看成交通未來的無人駕駛,人工智能在方方面面都幾乎是當下谷歌的技術核心。把自家的人工智能系統以開源的方式對外開放,從而使任何人,包括競爭對手,都可以看到系統的核心代碼并加以利用,谷歌這么做,是在故意作死么?
先說結論:人工智能,或者機器學習,本身不是即插即用的家用電器。只有系統沒有用,人工智能中的核心,谷歌是萬萬不敢對外開放的。
實際上,機器學習系統只是人工智能技術的冰山一角。谷歌保留下來的東西還有很多,比如說海量的數據,比如說運轉這一系統的強大網絡化計算機,比如說由調配算法的人工智能專家組成的龐大團隊。而賦予人工智能靈魂的,恰恰是谷歌沒有公開的東西。
用英國布里斯托爾大學(University of Bristol)的人工智能教授奈羅-克里斯坦尼尼(Nello Christanini)的話來說,“谷歌開源人工智能系統不是自殺行為。深度學習需要大量的測試、調試和適配工作。”
人工智能系統在進行深度學習某個領域的時候,需要通過大量數據進行“訓練”。幾年前,谷歌教會其系統識別貓的圖像時,就采用了大約1000萬張圖像,而這些圖像都是從YouTube中海量的視頻里截取出來的。處理這些圖像,又動用了由16000臺計算機組成的計算機網絡。
而在這個過程中,系統或許會受到數百萬條需要調整的參數。沒有相關工程師參與其中,自己搭建一套人工智能系統出來難于登天,谷歌公布出來的深度學習算法用處也極其有限。
調試參數是件需要從失敗和錯誤里汲取經驗的活兒。人工智能公司Loop AI Labs的首席科學家帕特里克-埃倫(Patrick Ehlen)在《華爾街日報》的采訪中說,“頭一次做這件事的人需要花上很長時間。”
實際上,谷歌公開自家系統的目的,是吸引到更多的人工智能專家,來為軟件的改進和應用出謀劃策。在官方的公告中,谷歌表達得非常清楚:“我們希望,這可以讓機器學習社區團體,包括學術科研人員、工程師、業余愛好者等在內的所有人都能夠通過代碼,而非僅僅是研究論文,實現更快的思想交流。”
除了谷歌,Facebook、微軟、百度大公司也在智能領域耕耘。開源人工智能系統更不是新鮮事。據彭博社報道Facebook就曾經開源過自家的深度學習系統Torch。而且谷歌旗下的人工智能創業公司DeepMind,采用的就是Facebook的系統。