2017年是人工智能技術全面開火、勇猛精進的一年,也是對未來全球科技和經濟影響深遠的一年。
無論人工智能圈子內外的從業者,都開始正視這個可能會很快改變所有人命運的熱門技術。關注、學習、思考、實踐人工智能技術及其相關應用,將是所有IT人未來多年將要面對的最重要的課題和命題。以下IT經理網根據WildML的報告,將2017年“萬物并作”的人工智能和機器學習領域的重大進度節點和資源工具梳理如下:
完全不依賴人類知識經驗的AlphaGo Zero擊敗人類,這比2016年AlphaGo擊敗李世石更加讓人震驚AlphaGo Zero的算法技術基于這篇已經發布的論文——《深度學習與樹搜索的快思與慢思》,當時間來到2017年底,AlphaGo Zero的通用算法版本AlphaZero問世,這個算法突破了圍棋領域的局限,砍瓜切菜般拿下了國際象棋、將棋等人類棋盤游戲的至尊寶座。至此,AlphaZero一統所有棋盤游戲江湖,成為水平遠超人類的“棋神”。
AlphaGo Zero完成對AlphaGo Master的超越,以及避開人類經驗干擾后產生的大量創新招法(參見谷歌發布的AlphaGo Zero圍棋教學工具)已經完全突破了人類數千年總結的基本圍棋規律和哲理,這意味著當面對極為復雜的計算難題(例如圍棋、生物醫藥、環境、交通、軟件開發等)時,人類的“寶貴”經驗和大數據最終有可能成為一種“負資產”,或者用專業一點的術語說,是“臟數據”、對抗性樣本,反而會阻礙機器突破人類智慧的天花板。
當人工智能開發的軟件bug更少,效率更高、疾病誤診率更低、股票交易成績更好、藥品研發成本更低時,我們大量的知識工人可能面對一個可怕的未來,不是駕馭人工智能,而是被人工智能徹底淘汰。
其實不僅僅是AlphaGo,2017年還有很多人工智能算法也取得了令人矚目的成就,首先是捷克科技大學、阿爾伯塔大學、查爾斯大學等聯合研發的DeepStack首次擊敗了人類職業撲克選手,隨后卡梅隆大學研發的人工智能算法Libratus(Science論文),在不完全信息的無限制一對一德州撲克比賽中擊敗了人類頂尖選手。
2018年,人工智能技術有望在多人游戲,例如撲克和星際爭霸中戰勝人類,DeepMind已經發布了針對星際爭霸2的人工智能技術研究環境,OpenAI則演示了在一對一的Dota 2游戲中戰勝人類的算法,并且計劃不久的未來在5v5的多人對戰游戲中也取得勝利。
進化式算法(Evolution Algorithms)東山再起Photo:Wired
對于監督式學習來說,使用反向傳播算法的漸進式方法效果向來不錯,未來短時間也不可能有太大變化。但是在增強學習中,進化策略(Evolution Strategies)卻有東山再起的趨勢。因為數據往往不是獨立分布,或者錯誤信號較為稀疏,或者還有較大探索空間,算法通常不需要漸進式方法也能取得顯著進步。另外,進化式算法可以線性擴展到數千臺服務器來支持超快并行培訓,計算不依賴昂貴的GPU,大量的廉價CPU就可以。
今年早些時候,OpenAI展示了進化策略能夠取得與Deep Q-Learning這樣的標準增強學習算法相當的成績,時至年底,Uber的一個團隊發表了一篇博客以及五篇研究論文,展示了Genetic算法的創新研究成果,一個極簡化的Genetic算法,不借助任何漸進信息,可以學會較為復雜的Atari游戲,在Frostbite(凍傷)這個游戲中,Genetic算法打出了10500分,而一些頂尖人類玩家的得分不到1000。
技術流變:WaveNets、卷積神經網絡(CNNs)與注意機制(Attention Mechanisms)谷歌公司的Tacotron 2文本到語音系統生成的極為自然的機器聲音樣本讓人印象深刻,該算法基于自回歸模型——WaveNet,在過去一年中,該模型也在谷歌助理中使用并在高保真語音合成方面取得顯著進步。此前WaveNet在機器翻譯也得到應用并大大加快了培訓速度,提高了回歸架構的效率。
在機器學習這個子領域,放棄昂貴且需要較長培訓時間的回歸架構已經成為大勢所趨,在Attention is all you Need一文中,研究者完全放棄了回歸和卷積架構,使用一個更佳復雜的注意機制(Attention Mechanisms),能以低的多的成本,取得極為出色的機器翻譯成績。
深度學習框架群雄并起圖片:wired
回顧2017年的人工智能市場,深度學習框架絕對是主角,Facebook推出的重量級框架PyTorch擅長處理動態圖譜架構,類似Chainer,贏得了自然語言處理專家們的喜愛,因為他們經常需要處理動態回歸架構,谷歌的靜態圖譜框架Tensorflow在這方面有些捉襟見肘。
但是,TensorFlow依然是2017年的框架之王,二月份谷歌發布了穩定的Tensorflow1.0版本,目前其版本已經迭代到1.4.1,除了主體框架外,谷歌還發布了一系列Tensorflow的伴侶程序庫,包括面向動態計算機圖形的Tensorflow Fold、面向數據輸入管線的Tensorflow Transform,以及DeepMind的高級Sonnet庫。值得注意的是,Tensorfow團隊還發布了一個eager execution執行模式,可以以類似PyTorch的方式處理動態計算機圖形。
除了Google和Facebook兩大巨頭外,很多公司也跳上了機器學習框架的花車:
蘋果發布了CoreML移動機器學習庫
Uber團隊發布了Pyro,一個深度概率編程語言
亞馬遜發布了Gluon,一個MXNet高級API。
Uber公布了內部機器學習基礎設施平臺“米開朗基羅”的技術細節。
除了通用深度學習框架,還涌現了大量增強學習框架,例如:
OpenAI Roboschool一個機器人模擬的開源框架
OpenAI Baselines 一組高質量的增強學習算法實現用例
Tensorflow Agents 包含了為使用Tensorflow訓練RL代理優化的基礎架構
Unity ML Agents 可供研究者和開發者使用Unity 編輯器開發游戲和模擬器,然后用增強學習訓練。
Nervana Coach 頂級增強學習算法的實驗平臺
Facebook’s ELF Facebook的游戲研發平臺
DeepMind Pycolab 一個可定制化的gridworld游戲引擎
Geek.ai MAgent一個支持多代理的增強學習研究平臺
為了進一步推廣深度學習,還出現了一些面向web的深度學習框架,例如谷歌的Deeplearn.js以及MIL WebDNN。但百花齊放也有未老先衰的,例如此前非常流行的框架Theano就停更了。
深度學習與增強學習資源匯總隨著深度學習和增強學習的流行,相關的演講、培訓和課程資源越來越豐富,以下是部分精華資源傳送: