他們創辦了一家創業公司——Wayve,全力研究自主汽車的機器學習。最近的動作,是讓一臺“啥都不懂”的電動車,沿一條小道繞行,自我學成。
聯合創始人兼首席執行官沙阿說,“自動駕駛的困惑,至于智能算法的缺失,而不是缺少傳感器、規則和地圖之類。人類具有在現實世界中執行復雜任務的卓越能力,大腦讓我們快速學習,并通過許多經驗傳遞知識。應該設法讓汽車的大腦更好使。”Wayve認為,學習系統的質量將是未來十年誰主導自主汽車市場的關鍵因素。
他們選用了雷諾公司專為城市駕駛者設計的小型電動汽車Twizy,在車頭裝上攝像頭,修改了計算機操作轉向、油門和剎車的功能,并連接到一個圖形處理單元,能實時、智能地分析攝像數據,運行一個基于實驗、優化和評估的學習程序。
試驗在一條狹窄、彎曲的小巷進行。人類駕駛員坐在駕駛座,而全部控制權交給汽車,讓它試著控制。每次汽車要偏離小道時,人類駕駛員就會出手糾正它。算法還會對汽車施以“懲罰”或“獎勵”,而獎勵的依據是它在沒有人為干預的條件下走了多遠。
我們在左圖中可以看到,在第一圈中(上),人類駕駛員忙碌地旋一個旋鈕,糾正方向;以后,汽車逐圈都有進步,到第11圈(下),汽車不需要人的幫忙就不跑偏了。在20分鐘時間內,不到20次的試駕,Twizy基本掌握了如何保持行駛在車道中。
Wayve在博客上說,“DeepMind向我們展示了深度強化學習方法,能在包括圍棋、象棋和電腦游戲在內的許多游戲中作出超越人類的表現,而這些,都是基于規則的系統。我們在這里展示的,是在現實世界,特別是自主車輛中也可能實現的類似方法。”
“設想有一隊自主汽車,駕駛算法最初是人駕駛質量的95%。這比我們在試驗中使用的隨機初始化模型已經好很多,幾乎能應付交通燈、環形線、交叉口等場合,不會晃晃悠悠。而經過有安全駕駛水準的人接管一天的駕駛并在線改進,也許提高到96%;一周后98%;一個月后99%。幾個月后,系統還可能超過人,因為它能得到來自眾多安全駕駛者的反饋。”
其實,當前的自駕車是配備了學習部件的,但那基于網絡。比如特斯拉的自動駕駛儀,記錄司機必然經歷并需要糾正的任何錯誤,并用它來幫助教育其他特斯拉在同一地區行駛。而Wayve的試驗是讓自駕車像人類駕駛者一樣,自行建立在現實世界的完整操作。這是個迷人的想法。