《星球大戰》中的人們已經完全習慣了擁有機器人的世界,機器人的應用出現在了方方面面,從農場到戰爭,人工智能的應用以融洽的方式融入我們的日常生活,成為社會結構的一部分。
而現實確實如此,人工智能也早以融入我們的日常生活。最簡單的例子就是Google搜索,實際上搜索引擎就是信息檢索(Information retriveal)的直接應用,而亞馬遜的商品推薦,更是推薦系統的直接應用,人工智能成熟的應用,很多將變成一種隱形的、無所不在的東西。
如今業界、學術界都在談人工智能。但是今天的人工智能百分之八九十是收集數據之后去進行機器學習,這個事情大家早就在做了。那當我們說人工智能的春天到來時,我們在說什么?
有三方面的原因,一方面是隨著語音識別、圖像識別、計算機視覺等技術日趨成熟,深度學習獲得突破,越來越多人工智能技術走出實驗室,取得商業化應用。另一方面是硬件的發展,計算速度的顯著提升。最后是數據的極大豐富,我們已經積累了大量數據,而且可穿戴設備和智能家居等智能設備也讓我們獲得更多的數據。
那為什么不叫機器學習的春天呢?主要原因是翠花聽起來不夠洋氣,一秒變Tiffany之后瞬間高大上起來。
人工智能的前景
人工智能的發展方向并不是開發出和人一樣思考的AI,而是像星球大戰上開發出各種細分領域里可以幫助到人們的智能系統。例如微軟推出的Skype interpreter能夠即時翻譯各種語言,用戶只管說話,Skype Translator 就會流暢地將用戶所說的話翻譯出來,這讓一對一的跨語言語音交談成為可能,在這點上已經很接近C-3PO禮儀機器人。又例如自動駕駛中的智能系統,能夠很好的專注于駕駛,這也很類似能夠幫助駕駛戰斗機的宇航技工機器人的BB8。
(微軟的Skype Interpretar 可以做到即時翻譯)
隨著可穿戴設備和智能家居、家庭機器人等越來越多的智能設備進入人們的日常生活,人工智能的應用將越來越廣泛。舉個例子,亞馬遜支持語音識別的Echo將集成各種功能,我們可以用語音直接預定 pizza、呼叫Uber 和播放 Spotify,甚至通過提供的接口控制Tesla,控制各種智能設備,比如冰箱、燈和空調。會洗衣服和做飯的機器人或者智能設備的出現,也將人類從一些繁瑣的日常活動中解放出來。
(Amazon 推出的Echo)
而在企業領域,越來越多的智能算法將提供更多企業服務,一方面將各種將重復的人工勞動,一個很好的例子就是客服領域,通過聊天機器人解決很多很多重復的問題。而另外一個例子就是安防領域,通過圖像識別或者語音識別能夠實現智能人臉抓拍與識別,另一方面提供更智能的企業服務,通過更多數據分析來幫助做更好的決策和推薦。
(微軟聊天機器人被玩壞 變身滿嘴臟話“不良少女”)
當越來越多的人使用AI,通過大量數據的積累,它就會變得更加智能。它變得更智能后,也會有更多人使用,就像搜索一樣成為生活的基礎設施,習以為常。
造錘子
那么硅谷的大小公司都在在圍繞人工智能在干什么?
總的來說,大公司都在開發和改善人工智能的一些算法,造錘子,或者做提供錘子的平臺,做生態。
谷歌研究深度學習(被稱為谷歌大腦計劃),以及收購DeepMind團隊。這些研究成功廣泛應用于搜索引擎。在谷歌大腦計劃中,計算機能夠自動識別詞類,理解句子含義,識別手寫字體、圖像和視頻。例如谷歌大腦通過三天的學習,可以識別出貓臉,研究人員從1000多萬個YouTube視頻縮略圖中隨機抽取20000張圖片,讓“谷歌大腦”進行訓練。訓練結束時進行測試,這個所謂的“大腦”識別貓類圖片的準確率基本達到四分之三。谷歌也在進行自然語言處理等方面的研究,利用“谷歌翻譯”我們也能得到各種語言的翻譯甚至是同聲傳譯。
(Google新的排序算法RankBrain 應用了Google Brain的成果)
遠在西雅圖的微軟在人工智能領域動作不斷。微軟研究院一直是最好的人工智能的研究中心,微軟也發布了的Cortana和Skype Interepter等一系列產品。微軟在2015年5月初發布了人工智能領域的牛津計劃,由一系列基于云端的機器學習相關的API,SDK和相關服務等組成,旨在讓開發人員們不需要繁復的機器學習背景也能開發跨平臺的更智能和更交互的應用。當時,牛津計劃率先開放了人臉識別、語音處理和計算機視覺三個部分。在今年的Window Build開發者大會上,微軟開發了Microsoft Bot Framework,開發者可以直接接入Microsoft Bot Framework來開發類似微軟小冰這樣的聊天機器人。微軟這些行為就是在做一個提供錘子的平臺。
(微軟推出的Microsoft Bot Framework可以用來構建聊天機器人)
而facebook同樣建立了Facebook AI Research(FAIR)研究中心,囊括了Yann LeCun等在內的一些人工智能學者。FAIR的研究領域包括深度學習,自然語言處理,計算機視覺和計算機圖形學等方面的研究。Facebook也在研究他們個人助理“Facebook M”,試圖PK蘋果的Siri、微軟的Cortana和Google Now。 facebook在人工智能領域也搞了很多大新聞,比如facebook在Torch(火炬)計劃中開源了許多深度學習的代碼庫,后來又開源了名為Big Sur的人工智能硬件平臺。
(Facebook 在自家聊天軟件Messensager 上推出Facebook M智能助手)
蘋果也大力搞人工智能,去年搞Apple Car時便大張旗鼓地從各個企業挖走自動駕駛車研究的相關人才。蘋果買買買的動作也一直不停,去年收購人工智能初創公司Perceptio來加強離線圖像分類功能,收購自然語言處理創業公司VocalIQ,來強化Siri功能。蘋果還收購了擁有12名員工的地圖可視化公司Mapsense。此外,去年蘋果還發布廣告,大規模招募人工智能和機器學習方面的人才。據說蘋果通過這次招聘募集了近百名機器學習的研究人才。不過蘋果向來是閉門造車。
除了這些大的商業公司,也有越來越多的非營利性的公司。非營利性的公司加入是人工智能研究的有益補充,高校等科研單位的人工智能研究往往苦于沒有工業界的數據,而大公司的人工智能研究成功由于商業原因往往不愿意公開,而Open AI等非營利性的公司能作為有益補充,一方面獲取業界的數據,一方面也將自己的成果開源和共享。 OpenAI是由特斯拉CEO馬斯克聯合“Paypal黑幫”等大佬發起的非盈利項目,已獲10億美元捐贈。而微軟聯合創始人保羅艾倫也捐贈了上億美元在2014年成立了Allen Institute for Artificial Intelligence(AI2)。
從總的趨勢上看,好的人工智能的應用,很多變成一種隱形的服務,而且能夠在很多領域超越人類。而人工智能本身其實早已作為“底層技術”,一把看不見的錘子,推動著新一輪的技術浪潮。人工智能在眾多領域的應用潛力,也會給行業發展帶來無限的想象力。
找釘子
如果說大公司都有財力去造錘子,而創業公司則很多集中于找釘子,利用相對成熟的語音識別自然語言處理和圖像識別技術,來解決一些生成和生活中的問題。或者為了特定的釘子改造錘子。
我們可以從Y Combinator 2016 年 Demo Day為首的硅谷公司中可見一斑。
有不少初創企業試圖為其他公司提供聊天機器人獲問答機器人,或者語音識別服務。
msg.ai:在各大社交平臺的 AI 聊天機器人
msg.ai 能幫助品牌整合在社交網絡上的表現,實時檢測流行話題,尋找新的銷售與參與機會。msg.ai 能夠讓聊天機器人實時自動與用戶互動,并且在出現無法處理的情況時將對話由機器人無縫轉交人類處理,幫助企業獲得更多商機。
類似企業還有:Chatfuel,讓普通企業擁有聊天機器人;DeepGram,最精準的關鍵詞語音識別技術
熱點研究領域還包括在人機交互中具有改革意義的手勢識別
LeapMotion:人工智能與虛擬現實的結合
Leap Motion是一家將人工智能與虛擬現實相結合的公司。他們利用機器學習技術對用戶的手勢進行識別分析,并配合虛擬現實硬件產品完成多種VR及AR的相關功能。他們成立于2010年,并完成了5輪融資總計4405萬美元。
類似產品還有:Sixense,新一代電子游戲輸入設備
還有一大類公司集中于數據的智能分析和處理,提供SaaS(軟件即服務)服務。
Elucify:幫助找到潛在客戶群
處理潛在的客戶數據是非常耗時的,大部分時間都浪費在數據整理和清洗上。Elucify通過使用人工智能技術,幫助企業在潛在的用戶數據中快速識別和整理舊的數據,快速提取有針對性的客戶線索,動態的搜索和更新潛在的客戶數據。
類似企業還有:PaveIQ,企業市場策略分析;Nova,幫你更好的寫郵件
人工智能的研究也可以結合可穿戴設備
Hykso:給拳擊手用的分析工具
Hysko推出一款產品,可以跟蹤速度、強度、數量和其他方面的一舉一動,并提供具有洞察力的產品。這很像 Fitbit,但這是針對拳擊手的。它提供了實時監控,有助于玩家不斷改造錯誤和不斷提升。
人工智能的研究也可以結合智能家居
典型的例子就是前文提到Echo,詳情可見亞馬遜重磅產品“Echo”的內幕消息
還有個非常熱門的應用領域是無人駕駛技術
Cruise:專精研制無人駕駛設備
Cruise Automation是一家總部位于舊金山的初創企業。原先公司做的是半自動的轉換系統,不過在2015年Cruise已經實現了“全棧”無人駕駛技術,它制造的傳感器可將普通車輛變成自動駕駛的汽車。Cruise成立于2013年,在2016年3月被通用汽車以10億美元收購,在此之前總計完成3輪融資共1880萬美元。
也有創業公司想做平臺,做賣錘子的生意
Skymind:深度學習界的Cloudera
Skymind 自稱是 AI 中的 Cloudera,幫助企業級 Hadoop 和 Spark 用戶進行深度學習。利用 Skymind 的開源框架 Deeplearning4j,大型機構可以構建軟件解決方案。Skymind 的用途包括詐騙檢測、時間序列數據分析、文本分析、圖像 / 面部識別和語音識別。
當然,怎么會少的了機器人呢?
Fetch Robotics:會識別取貨的機器人
其主要產品Fetch和Freight可利用攝像頭、圖像處理和導航技術等,根據訂單內容,利用機械臂將位于貨架某一位置上的特定商品取下來,然后交給Freight運回打包。不工作時,機器人會自動返回充電樁進行充電。Fetch Robotics成立于2014年,在2015年6月完成了A輪融資2000萬美元,總計共完成2輪融資共2300萬美元。
類似企業包括:Gecko Robotics ,電廠安全檢查機器人。
總結這些公司,我們發現人工智能顯然不只是大公司的之間的游戲,初創企業也紛紛融入,用人工智能的技術解決很多實際的問題,為企業或者消費者提供價值。目前很神奇的情況是初創企業在人工智能的領域的方向很多都是面向企業做SaaS,而消費者領域的人工智能應用很多都是谷歌微軟和facebook等大公司在做。
更多數據,更多智能
目前人工智能的應用已經出現在了生活的很多地方,更多的數據,更多的人工智能,而人工智能新的爆發點也將是集中在過去缺乏數據或者缺乏分析的地方
在消費者領域,人工智能的發展將和移動互聯網、智能家居、可穿戴設備的普及緊密結合,人工智能將有越來越多的應用場景。
在企業領域,人工智能的發展也將結合企業服務(SaaS)的趨勢,為企業提供更多智能服務。
人工智能是近年來高速發展且應用非常廣泛的技術領域。當Google的AlphaGo利用深度學習技術在圍棋領域擊敗了人類之后,人工智能越發受到各行各業的廣泛關注。
人工智能是科幻電影《星球大戰》中的重要部分。智能機器到處都是。從酷似Sheldon、精通各國語言的C-3PO禮儀機器人,到擅長太空船修理和電腦接口的宇航技工機器人R2D2。
《星球大戰》中的人們已經完全習慣了擁有機器人的世界,機器人的應用出現在了方方面面,從農場到戰爭,人工智能的應用以融洽的方式融入我們的日常生活,成為社會結構的一部分。
而現實確實如此,人工智能也早以融入我們的日常生活。最簡單的例子就是Google搜索,實際上搜索引擎就是信息檢索(Information retriveal)的直接應用,而亞馬遜的商品推薦,更是推薦系統的直接應用,人工智能成熟的應用,很多將變成一種隱形的、無所不在的東西。
如今業界、學術界都在談人工智能。但是今天的人工智能百分之八九十是收集數據之后去進行機器學習,這個事情大家早就在做了。那當我們說人工智能的春天到來時,我們在說什么?
有三方面的原因,一方面是隨著語音識別、圖像識別、計算機視覺等技術日趨成熟,深度學習獲得突破,越來越多人工智能技術走出實驗室,取得商業化應用。另一方面是硬件的發展,計算速度的顯著提升。最后是數據的極大豐富,我們已經積累了大量數據,而且可穿戴設備和智能家居等智能設備也讓我們獲得更多的數據。
那為什么不叫機器學習的春天呢?主要原因是翠花聽起來不夠洋氣,一秒變Tiffany之后瞬間高大上起來。
人工智能的前景
人工智能的發展方向并不是開發出和人一樣思考的AI,而是像星球大戰上開發出各種細分領域里可以幫助到人們的智能系統。例如微軟推出的Skype interpreter能夠即時翻譯各種語言,用戶只管說話,Skype Translator 就會流暢地將用戶所說的話翻譯出來,這讓一對一的跨語言語音交談成為可能,在這點上已經很接近C-3PO禮儀機器人。又例如自動駕駛中的智能系統,能夠很好的專注于駕駛,這也很類似能夠幫助駕駛戰斗機的宇航技工機器人的BB8。
(微軟的Skype Interpretar 可以做到即時翻譯)
隨著可穿戴設備和智能家居、家庭機器人等越來越多的智能設備進入人們的日常生活,人工智能的應用將越來越廣泛。舉個例子,亞馬遜支持語音識別的Echo將集成各種功能,我們可以用語音直接預定 pizza、呼叫Uber 和播放 Spotify,甚至通過提供的接口控制Tesla,控制各種智能設備,比如冰箱、燈和空調。會洗衣服和做飯的機器人或者智能設備的出現,也將人類從一些繁瑣的日常活動中解放出來。
(Amazon 推出的Echo)
而在企業領域,越來越多的智能算法將提供更多企業服務,一方面將各種將重復的人工勞動,一個很好的例子就是客服領域,通過聊天機器人解決很多很多重復的問題。而另外一個例子就是安防領域,通過圖像識別或者語音識別能夠實現智能人臉抓拍與識別,另一方面提供更智能的企業服務,通過更多數據分析來幫助做更好的決策和推薦。
(微軟聊天機器人被玩壞 變身滿嘴臟話“不良少女”)
當越來越多的人使用AI,通過大量數據的積累,它就會變得更加智能。它變得更智能后,也會有更多人使用,就像搜索一樣成為生活的基礎設施,習以為常。
造錘子
那么硅谷的大小公司都在在圍繞人工智能在干什么?
總的來說,大公司都在開發和改善人工智能的一些算法,造錘子,或者做提供錘子的平臺,做生態。
谷歌研究深度學習(被稱為谷歌大腦計劃),以及收購DeepMind團隊。這些研究成功廣泛應用于搜索引擎。在谷歌大腦計劃中,計算機能夠自動識別詞類,理解句子含義,識別手寫字體、圖像和視頻。例如谷歌大腦通過三天的學習,可以識別出貓臉,研究人員從1000多萬個YouTube視頻縮略圖中隨機抽取20000張圖片,讓“谷歌大腦”進行訓練。訓練結束時進行測試,這個所謂的“大腦”識別貓類圖片的準確率基本達到四分之三。谷歌也在進行自然語言處理等方面的研究,利用“谷歌翻譯”我們也能得到各種語言的翻譯甚至是同聲傳譯。
(Google新的排序算法RankBrain 應用了Google Brain的成果)
遠在西雅圖的微軟在人工智能領域動作不斷。微軟研究院一直是最好的人工智能的研究中心,微軟也發布了的Cortana和Skype Interepter等一系列產品。微軟在2015年5月初發布了人工智能領域的牛津計劃,由一系列基于云端的機器學習相關的API,SDK和相關服務等組成,旨在讓開發人員們不需要繁復的機器學習背景也能開發跨平臺的更智能和更交互的應用。當時,牛津計劃率先開放了人臉識別、語音處理和計算機視覺三個部分。在今年的Window Build開發者大會上,微軟開發了Microsoft Bot Framework,開發者可以直接接入Microsoft Bot Framework來開發類似微軟小冰這樣的聊天機器人。微軟這些行為就是在做一個提供錘子的平臺。
(微軟推出的Microsoft Bot Framework可以用來構建聊天機器人)
而facebook同樣建立了Facebook AI Research(FAIR)研究中心,囊括了Yann LeCun等在內的一些人工智能學者。FAIR的研究領域包括深度學習,自然語言處理,計算機視覺和計算機圖形學等方面的研究。Facebook也在研究他們個人助理“Facebook M”,試圖PK蘋果的Siri、微軟的Cortana和Google Now。 facebook在人工智能領域也搞了很多大新聞,比如facebook在Torch(火炬)計劃中開源了許多深度學習的代碼庫,后來又開源了名為Big Sur的人工智能硬件平臺。
(Facebook 在自家聊天軟件Messensager 上推出Facebook M智能助手)
蘋果也大力搞人工智能,去年搞Apple Car時便大張旗鼓地從各個企業挖走自動駕駛車研究的相關人才。蘋果買買買的動作也一直不停,去年收購人工智能初創公司Perceptio來加強離線圖像分類功能,收購自然語言處理創業公司VocalIQ,來強化Siri功能。蘋果還收購了擁有12名員工的地圖可視化公司Mapsense。此外,去年蘋果還發布廣告,大規模招募人工智能和機器學習方面的人才。據說蘋果通過這次招聘募集了近百名機器學習的研究人才。不過蘋果向來是閉門造車。
除了這些大的商業公司,也有越來越多的非營利性的公司。非營利性的公司加入是人工智能研究的有益補充,高校等科研單位的人工智能研究往往苦于沒有工業界的數據,而大公司的人工智能研究成功由于商業原因往往不愿意公開,而Open AI等非營利性的公司能作為有益補充,一方面獲取業界的數據,一方面也將自己的成果開源和共享。 OpenAI是由特斯拉CEO馬斯克聯合“Paypal黑幫”等大佬發起的非盈利項目,已獲10億美元捐贈。而微軟聯合創始人保羅艾倫也捐贈了上億美元在2014年成立了Allen Institute for Artificial Intelligence(AI2)。
從總的趨勢上看,好的人工智能的應用,很多變成一種隱形的服務,而且能夠在很多領域超越人類。而人工智能本身其實早已作為“底層技術”,一把看不見的錘子,推動著新一輪的技術浪潮。人工智能在眾多領域的應用潛力,也會給行業發展帶來無限的想象力。
找釘子
如果說大公司都有財力去造錘子,而創業公司則很多集中于找釘子,利用相對成熟的語音識別自然語言處理和圖像識別技術,來解決一些生成和生活中的問題。或者為了特定的釘子改造錘子。
我們可以從Y Combinator 2016 年 Demo Day為首的硅谷公司中可見一斑。
有不少初創企業試圖為其他公司提供聊天機器人獲問答機器人,或者語音識別服務。
msg.ai:在各大社交平臺的 AI 聊天機器人
msg.ai 能幫助品牌整合在社交網絡上的表現,實時檢測流行話題,尋找新的銷售與參與機會。msg.ai 能夠讓聊天機器人實時自動與用戶互動,并且在出現無法處理的情況時將對話由機器人無縫轉交人類處理,幫助企業獲得更多商機。
類似企業還有:Chatfuel,讓普通企業擁有聊天機器人;DeepGram,最精準的關鍵詞語音識別技術
熱點研究領域還包括在人機交互中具有改革意義的手勢識別
LeapMotion:人工智能與虛擬現實的結合
Leap Motion是一家將人工智能與虛擬現實相結合的公司。他們利用機器學習技術對用戶的手勢進行識別分析,并配合虛擬現實硬件產品完成多種VR及AR的相關功能。他們成立于2010年,并完成了5輪融資總計4405萬美元。
類似產品還有:Sixense,新一代電子游戲輸入設備
還有一大類公司集中于數據的智能分析和處理,提供SaaS(軟件即服務)服務。
Elucify:幫助找到潛在客戶群
處理潛在的客戶數據是非常耗時的,大部分時間都浪費在數據整理和清洗上。Elucify通過使用人工智能技術,幫助企業在潛在的用戶數據中快速識別和整理舊的數據,快速提取有針對性的客戶線索,動態的搜索和更新潛在的客戶數據。
類似企業還有:PaveIQ,企業市場策略分析;Nova,幫你更好的寫郵件
人工智能的研究也可以結合可穿戴設備
Hykso:給拳擊手用的分析工具
Hysko推出一款產品,可以跟蹤速度、強度、數量和其他方面的一舉一動,并提供具有洞察力的產品。這很像 Fitbit,但這是針對拳擊手的。它提供了實時監控,有助于玩家不斷改造錯誤和不斷提升。
人工智能的研究也可以結合智能家居
典型的例子就是前文提到Echo,詳情可見亞馬遜重磅產品“Echo”的內幕消息
還有個非常熱門的應用領域是無人駕駛技術
Cruise:專精研制無人駕駛設備
Cruise Automation是一家總部位于舊金山的初創企業。原先公司做的是半自動的轉換系統,不過在2015年Cruise已經實現了“全棧”無人駕駛技術,它制造的傳感器可將普通車輛變成自動駕駛的汽車。Cruise成立于2013年,在2016年3月被通用汽車以10億美元收購,在此之前總計完成3輪融資共1880萬美元。
也有創業公司想做平臺,做賣錘子的生意
Skymind:深度學習界的Cloudera
Skymind 自稱是 AI 中的 Cloudera,幫助企業級 Hadoop 和 Spark 用戶進行深度學習。利用 Skymind 的開源框架 Deeplearning4j,大型機構可以構建軟件解決方案。Skymind 的用途包括詐騙檢測、時間序列數據分析、文本分析、圖像 / 面部識別和語音識別。
當然,怎么會少的了機器人呢?
Fetch Robotics:會識別取貨的機器人
其主要產品Fetch和Freight可利用攝像頭、圖像處理和導航技術等,根據訂單內容,利用機械臂將位于貨架某一位置上的特定商品取下來,然后交給Freight運回打包。不工作時,機器人會自動返回充電樁進行充電。Fetch Robotics成立于2014年,在2015年6月完成了A輪融資2000萬美元,總計共完成2輪融資共2300萬美元。
類似企業包括:Gecko Robotics ,電廠安全檢查機器人。
總結這些公司,我們發現人工智能顯然不只是大公司的之間的游戲,初創企業也紛紛融入,用人工智能的技術解決很多實際的問題,為企業或者消費者提供價值。目前很神奇的情況是初創企業在人工智能的領域的方向很多都是面向企業做SaaS,而消費者領域的人工智能應用很多都是谷歌微軟和facebook等大公司在做。
更多數據,更多智能
目前人工智能的應用已經出現在了生活的很多地方,更多的數據,更多的人工智能,而人工智能新的爆發點也將是集中在過去缺乏數據或者缺乏分析的地方
在消費者領域,人工智能的發展將和移動互聯網、智能家居、可穿戴設備的普及緊密結合,人工智能將有越來越多的應用場景。
在企業領域,人工智能的發展也將結合企業服務(SaaS)的趨勢,為企業提供更多智能服務。
人工智能是近年來高速發展且應用非常廣泛的技術領域。當Google的AlphaGo利用深度學習技術在圍棋領域擊敗了人類之后,人工智能越發受到各行各業的廣泛關注。