且問 AI 老司機表現如何?
可靈活轉彎,控速自如:
可行云流水,沿最優路線過彎:
更可多次打圈,繞多少下也不在話下:
這場競速賽事,主角確實是一群 AI 老司機,人類全程只能看,也沒有什么遙控器參與。
更準確地說,它們是歷經千萬次虛擬練車訓練出來的人工智能模型。這些模型所角逐的賽事也在業內頗具盛名,這就是亞馬遜云科技舉辦的——
Amazon DeepRacer League。
作為全球最多開發者參與的自動駕駛賽車聯賽,Amazon DeepRace 不拼誰更有錢買跑車,更不拼誰有資源搞場地,只拼選手們寫的強化學習算法和訓練水平——
堪稱全球智力水平選秀綜藝,充分詮釋“ Smart is the new sexy ”的真正奧義。
開辦至今, Amazon DeepRacer 在 AI/ML 圈已有相當名氣,14萬開發者參與其中,知乎上還有鐵粉曬經歷、Po證書。
大眾影響力水漲船高,僅一部預告片就有380萬播放量。
隨著賽事越辦越破圈,去年,Amazon DeepRacer League 更與 F1 官方搞起聯名,舉辦了一場虛擬“巴塞羅那站”比賽,坐實自動駕駛界 F1 名頭。
所以,這個 Amazon DeepRacer 什么來頭?為什么讓技術愛好者們如此上頭?
最多開發者參與的自動駕駛聯賽
2018年,亞馬遜云科技萌生舉辦 AI 算法大賽念頭,讓更多人了解相關技術,甚至入門成為從業者,Amazon DeepRacer League 應運而生。
活動一開始就面向非業內群體,官方提供了幾乎所有參賽軟件資源,甚至有教程攻略,參與者甚至無需花錢購買實體小車,可以先在云平臺上 3D 賽車模擬器,訓練自己的自動駕駛算法。
入門后,參與者即可報名參加每個月的線上預選賽。如果你沖入全球前64強,就能獲得線下聯賽參賽資格——
和世界各路高手實地 PK 你的模型。
雖說門檻低,比賽獎金也卻很高。
冠軍將獲得10000美元的獎金,亞軍則獎勵5000美元,季軍2000美元。
低門檻加上高額獎金,玩的還是前沿技術,比賽自打舉辦,吸引了全球不同背景的人們關注。
參與者中,既有硅谷全棧開發人員、飛行員,來自新加坡、加拿大銀行員工,還有中國大學生……
不同背景參與者加入,不僅體現比賽多元性,讓機器學習技術為更多人所知,同時,也為比賽增添許多有意思的小片段。
比如 Amazon DeepRacer TV 2019年決賽中,一位中國臺灣小哥逆轉獲勝后,贏得冠軍,但發表獲獎感言時,他卻用了中文表達自己的心情,整得英語主持人一時不知道怎么接話…
值得一提的是,今年DeepRacer也開始在國內舉辦面向中國開發者的中國挑戰賽,獎品同樣豐厚,值得關注與期待。
如何馴服一只無人車?
從賽場回顧技術理論,實際上,Amazon DeepRacer 活動背后的基礎即簡單又前沿。
如何理解這句話?
不妨先從一輛自動駕駛小車構造展開。
Amazon DeepRacer 的自動駕駛小車有代際區分。一代車是參賽主力,核心包括一個 Intel Atom® 處理器,一個四百萬像素1080p分辨率攝像頭,一個高速 WiFi 以及 Intel OpenVino 計算機視覺工具套件。一代車主要用于競速比賽,通過視覺識別判定賽道,完成比賽。
更高階的是二代車 DeepRacer Evo ,配備立體攝像頭和激光雷達,可用于可進行追逐賽與避障賽。
如果熟悉自動駕駛,你可能也能看出這一配置可謂“樸素”,卻足夠體驗自動駕駛的樂趣——
這是因為 真正賦予小車自動駕駛靈魂的,是算法與模型。
同當今馬路上的自動駕駛車一樣,Amazon DeepRacer 同樣使用到機器學習門類下的一門技術:
強化學習(RL)。
該項技術興起不過數年,卻算得上是近些年人類最重要的技術突破之一。2016年戰勝李世石的 AlphaGo 背后就是該技術發揮作用。
強化學習原理不難理解,就是一種“馴獸師”機制,也可以理解為「巴浦洛夫的狗」原理。
以“小雞啄紙”為例:
如果我們想訓練一只雞啄粉色紙片,那么,每當它啄到粉色紙片時,就獎勵給食物。
經過一番訓練后,這只雞就一直能正確找到粉色紙片了。
當然,獎勵無人小車和電腦不能用食物,而是用它們能懂的“獎勵函數”( Reward Function )。
對于 Amazon DeepRacer 來說,開發者可以設置一個超級簡單的獎勵函數,它只有兩個參數:all_wheels_on_track 表示四個輪子是否全在賽道內, progress 代表當前完成進度。
具體到代碼上,如果有車輪不在賽道上發生一次,就扣除獎勵函數,反之,就一直以小車走過的進度來獎勵它。
獎勵函數的值越大,就說明訓練越成功,當獎勵函數為負值時,任務失敗。
如果想讓小車更聰明,不要在跑道上拐來拐去,我們還可以把函數設置得稍微復雜一點,以小車偏離跑道中心虛線的距離作為一個參數。距離越小,則獎勵越大。
訓練過程中,小車通過攝像頭等記錄自己的位置,不斷調整車速和行駛方向,當獎勵函數最大化且穩定后——
“馴獸”就完成了,恭喜,你已掌握強化學習的根本原理。
如何參賽?
比賽熱血好玩,還有獎金可拿,原理易懂,現在,你是不是迫不及待想玩玩?
參與方式很簡單:只需注冊一個亞馬遜云科技賬戶就行。
登陸賬號進入 Amazon DeepRacer 控制臺。
在構建模型之前,先在車庫配置一輛自己的虛擬賽車。
給它起一個炫酷的名字(名字不可以更改,千萬不要取個“ test ”就完事了),選個你喜歡的顏色并根據你要參加的比賽類型配置攝像頭。
創建好專屬虛擬小車后,按照提示一步步創建模型:
官方還提供虛擬環境,降低上手門檻,讓小車在虛擬世界中訓練,完成后,就可提交模型選一場比賽參加了!
參與線上競賽不需要實體小車,直接參與即可。
等你在虛擬練車領域嶄露頭角后,也能可以獲得亞馬遜云科技免費贈送的實體小車,價值300美元。
當然,不差錢的話,也可直接在官網購買:
買小車雖說要花點錢,不過確實更添玩樂趣味,你可以在家里復刻賽道,隨時進行練習。
據說,還有人為了拿個好成績直接換了大房子,在自家地下車庫里復刻了賽道練習(手動狗頭)——
官網也貼心地提供了在家搭建賽道的教程:
最后,劃重點,提供一些薅官方羊毛機會。
如果你是新用戶首次參加 Amazon DeepRacer 項目,第一個月可以獲得10小時的免費訓練時長以及5GB的存儲空間。
除了免費時長,Amazon DeepRacer 還提供了免費的視頻教程教你強化學習的基礎知識、比賽入門指導。
比賽技巧也是重點,官方網頁上連單圈記錄保持者寫的攻略都要來了:
所以,不論你是技術小白還是有經驗的機器學習從業人員,都可以放心大膽地參與進來。
賽車游戲讓更多人入門 AI
如前面所說,亞馬遜云科技2018年就想以游戲活動方式推廣 AI 算法,后來才有 Amazon Deepracer ,此舉目的,在于面對 AI/ML 發展勢頭洶涌,這家大廠期望讓更多人了解相關技術,進而參與其中。
就拿 Amazon Deepracer 來說,為擴大參賽人群,亞馬遜云科技還發起一項針對16歲以上高中生和大學生的學生比賽,注冊無需信用卡即可參與。
此外,如果完成所有學習模塊,在所有課程測試中獲得至少80%分數,又在學生聯盟中單圈成績優異,還可以獲得一份獎學金。前500名的學生,還將獲得亞馬遜云科技和英特爾的技術專家指導,為期12個月。
不止于 Amazon DeepRacer ,亞馬遜云科技為讓不同背景的人都可以了解并入門機器學習,在方方面面都有所動作。
比如,提供1000萬美金的亞馬遜云科技 AI&ML 獎學金計劃;
比如,發布無代碼機器學習圖形界面 Amazon SageMaker Canvas ,幫助零機器學習經驗的企業級用戶解決業務問題,讓各個業務背景的人都能上手。
再比如,面向更多開發者,提供免費算力的機器學習“實驗室” Amazon Sagemaker Studio Lab ……
相信只有越來越多人了解并上手 AI/ML 相關技術和產品,這一興起不過10年的浪潮才能真正釋出價值。