2024年,全球科技目光領(lǐng)聚焦到了兩個(gè)關(guān)鍵詞上:一曰大模型,二曰人形機(jī)器人。
大模型掀起了新一輪全球人工智能革命,人形機(jī)器人則借力大模型這個(gè)催化劑,開(kāi)始向產(chǎn)業(yè)落地方向大踏步前進(jìn),創(chuàng)造看得見(jiàn),更摸得著的具身智能。
作為一年一度的全球科技盛會(huì),9月19日,阿里云棲大會(huì)再度開(kāi)幕,回應(yīng)了這個(gè)技術(shù)主旋律。
與往屆云棲大會(huì)相同的是,今年的云棲大會(huì)依據(jù)聚焦前沿科技、產(chǎn)業(yè)落地,不僅將大模型、人形機(jī)器人等明星產(chǎn)品邀請(qǐng)到了現(xiàn)場(chǎng),還為現(xiàn)場(chǎng)觀眾設(shè)置了一系列互動(dòng)環(huán)節(jié);
與往屆云棲大會(huì)不同的是,在今年云棲大會(huì)主論壇上,阿里特別設(shè)置了大模型、自動(dòng)駕駛、人形機(jī)器人三場(chǎng)巔峰對(duì)話,邀請(qǐng)相關(guān)領(lǐng)域知名學(xué)者、科學(xué)家現(xiàn)場(chǎng)研討前沿技術(shù)命題。
這其中,尤以作為壓軸的人形機(jī)器人對(duì)話——《人形機(jī)器人的“圖靈時(shí)刻”》最受關(guān)注。
本場(chǎng)對(duì)話邀請(qǐng)到了清華大學(xué)交叉信息研究院助理教授、星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇,北京大學(xué)助理教授、北大-銀河通用具身智能聯(lián)合實(shí)驗(yàn)室主任、智源學(xué)者王鶴,宇樹(shù)科技創(chuàng)始人、CEO王興興,逐際動(dòng)力創(chuàng)始人張巍四位明星創(chuàng)業(yè)者,由至頂科技CEO兼總編輯高飛主持。
圓桌上的十個(gè)提問(wèn)和回答,不僅可以看作是人形機(jī)器人創(chuàng)業(yè)者們的心路歷程,也是半個(gè)世紀(jì)人形機(jī)器人產(chǎn)業(yè)發(fā)展的階段性總結(jié)。
從左至右依次為:至頂科技CEO兼總編輯高飛,星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇,北京大學(xué)助理教授、北大-銀河通用具身智能聯(lián)合實(shí)驗(yàn)室主任、智源學(xué)者王鶴,宇樹(shù)科技創(chuàng)始人兼CEO王興興,逐際動(dòng)力創(chuàng)始人張巍
【1】問(wèn)初心:為什么是人形機(jī)器人?
人類(lèi)對(duì)于人形機(jī)器人的探索可以追溯到半個(gè)世紀(jì)之前,早稻田大學(xué)1972年研發(fā)的WABOT被視為人類(lèi)探索人形機(jī)器人的開(kāi)端,這之后,行業(yè)中也曾出現(xiàn)過(guò)本田ASIMO、波士頓動(dòng)力Atlas這樣驚世艷俗的產(chǎn)品。
作為最適合應(yīng)用于本就為人類(lèi)設(shè)定的各種工作、生活場(chǎng)景中的產(chǎn)品形態(tài),人形機(jī)器人不僅僅是人類(lèi)科學(xué)家的執(zhí)念。
提問(wèn)一:王興興作為機(jī)器人創(chuàng)業(yè)者,一開(kāi)始反對(duì)做人形機(jī)器人,后來(lái)又堅(jiān)決做人形機(jī)器人,是什么讓他改變態(tài)度?
王興興:幾年前有投資人問(wèn)我做不做人形機(jī)器人,我是堅(jiān)決反對(duì)的,原因很簡(jiǎn)單,我在大學(xué)的時(shí)候做過(guò)一個(gè)小型的人形機(jī)器人,當(dāng)時(shí)發(fā)現(xiàn),以當(dāng)時(shí)的技術(shù)無(wú)法駕馭這么復(fù)雜的機(jī)器人系統(tǒng),所以我們沒(méi)有做人形機(jī)器人。
自2016年開(kāi)始,人工智能技術(shù)得到了飛速發(fā)展,到2022年時(shí),AI模型的效果已經(jīng)非常驚艷,這樣的技術(shù)發(fā)展遠(yuǎn)超我自己的預(yù)計(jì),所以我們?cè)?023年年初開(kāi)始涉足人形機(jī)器人領(lǐng)域。
雖然我們公司做人形機(jī)器人起步相對(duì)較晚,但到現(xiàn)在差不多一年半的時(shí)間,我們已經(jīng)發(fā)布過(guò)兩款人形機(jī)器人,目前取得的成果還是非常驚艷的,在機(jī)器人領(lǐng)域我們一直在按照自己的發(fā)展節(jié)奏走。
提問(wèn)二:逐際動(dòng)力將自己定義為通用機(jī)器人公司,為什么通用機(jī)器人一定要做成人形?
張巍:我認(rèn)為一定要做成人形,而且是有兩條腿的人形機(jī)器人,我對(duì)這件事的理解是,首先機(jī)器人和AI的使命是不同的,AI代替人來(lái)思考決策,機(jī)器人本質(zhì)上要代替人類(lèi)運(yùn)動(dòng),所以它必須要能動(dòng)。
大家看到的機(jī)器人種類(lèi)很多,這些機(jī)器人本質(zhì)在做兩件事:
第一,移動(dòng),空間中從A到B;
第二,操作。
所謂的通用機(jī)器人,就是要在這兩個(gè)能力上都達(dá)到和人一樣的環(huán)境適應(yīng)和任務(wù)泛化兩大能力。
通用移動(dòng)能力其實(shí)不太需要雙臂,只要能從A移動(dòng)到B就可以,但是通用的操作能力反而是需要雙腿的,否則機(jī)器人將無(wú)法到達(dá)人類(lèi)能到達(dá)的地方去干活。
當(dāng)下AGI的發(fā)展相較于上一代AI技術(shù)最大的區(qū)別是從專(zhuān)用到通用的變化,大模型出現(xiàn)之前,通用感覺(jué)是個(gè)貶義詞,一說(shuō)通用證明它什么都能干,卻沒(méi)什么用。
但是大模型出現(xiàn)后,大家發(fā)現(xiàn),像之前我們這種在專(zhuān)業(yè)領(lǐng)域收數(shù)據(jù)、做專(zhuān)項(xiàng)任務(wù)訓(xùn)練的方式有很大的局限性,反而我們要忽略解決專(zhuān)項(xiàng)任務(wù)的能力,要先構(gòu)建一個(gè)通用的基礎(chǔ)模型,再基于此長(zhǎng)出專(zhuān)用能力,這才是系統(tǒng)化解決泛化性的關(guān)鍵。
我認(rèn)為,軟件算法的通用性靠大模型技術(shù),機(jī)器人和物理世界交互的通用性需要靠人性機(jī)器人,這也是我們公司關(guān)注的方向。
提問(wèn)三:銀河通用的機(jī)器人除了有腿形態(tài)的,還有輪式的,什么形態(tài)的機(jī)器人符合人形機(jī)器人的定義?
王鶴:我們公司叫銀河通用,從公司成立第一天我們的目標(biāo)就是要實(shí)現(xiàn)通用機(jī)器人,當(dāng)然,通用有一個(gè)發(fā)展過(guò)程,首先是要做到單一場(chǎng)景多任務(wù)可移動(dòng),其次要做到多場(chǎng)景多任務(wù),最后要做到全場(chǎng)景、幾乎全任務(wù)。
在這個(gè)過(guò)程中,不同階段也有它最適合、最經(jīng)濟(jì)、最穩(wěn)定的載體,當(dāng)下人形機(jī)器人或者說(shuō)通用機(jī)器人,我們選擇了先從幾個(gè)場(chǎng)景里的多任務(wù)做起,例如零售商超場(chǎng)景的上貨下貨、工廠里抱箱子。
在這些場(chǎng)景中,我們發(fā)現(xiàn)如果場(chǎng)景是平地的話,輪子是夠用的,也不能說(shuō)我們沒(méi)有腿,我們是把兩條腿并在了一起——在360°可旋轉(zhuǎn)輪盤(pán)上,我們兩只腿并在一起,它可以跪下來(lái),這樣機(jī)器人的手就可以碰到地面、撿地面上的東西。
為什么要雙手?
因?yàn)槲覀儼l(fā)現(xiàn)在諸如抱箱子你要兩只手,你在超市里買(mǎi)東西是一只手拿籃子,一只手拿貨,也是要兩只手,所以我們的形態(tài)目前是360°輪式底盤(pán)+雙腿并成一條腿,1.73m-2.4m,蹲下來(lái)可以摸地,用最便宜的價(jià)格、最穩(wěn)定的機(jī)器人技術(shù),率先實(shí)現(xiàn)商用落地。
提問(wèn)四:具身智能和人形機(jī)器人,很多人將它們視作一個(gè)概念,如何有一個(gè)清晰的劃分?
陳建宇:雖然這兩個(gè)詞非常接近,但是他們的側(cè)重點(diǎn)還是不相同的。
具身智能主要是關(guān)注我們智能和軟件層面的技術(shù),它對(duì)形態(tài)要求不高,可以是人形,也可以是四足,甚至輪式底盤(pán)+機(jī)械臂,它是一個(gè)廣泛的概念。
人形機(jī)器人將機(jī)器人形態(tài)限定在了人形,它不僅僅要研究人形機(jī)器人的具身智能怎么做,同時(shí)也需要研究它的本體怎么做,這里面有很多挑戰(zhàn)。
我們星動(dòng)紀(jì)元非常重視具身智能和人形機(jī)器人兩個(gè)領(lǐng)域,其實(shí)也代表我們非常重視軟件和硬件的協(xié)同一體發(fā)展。
對(duì)于人類(lèi)而言,人腦和身體是不可分割的,我們認(rèn)為機(jī)器人的軟件和硬件也需要協(xié)同發(fā)展。
【2】問(wèn)門(mén)道:人形機(jī)器人難在哪里?
波士頓動(dòng)力Atlas在過(guò)去很長(zhǎng)一段時(shí)間里,都被視為人形機(jī)器人領(lǐng)域明星般的存在,跑酷、跳遠(yuǎn)、后空翻,種種擬人行為,讓波士頓動(dòng)力運(yùn)動(dòng)能力讓世人咂舌。
運(yùn)動(dòng)能力超強(qiáng),但卻遲遲無(wú)法走出“屏幕”,直到波士頓動(dòng)力向外界公布執(zhí)行運(yùn)動(dòng)任務(wù)的一系列失敗視頻,大家才發(fā)現(xiàn),原來(lái)波士頓動(dòng)力絲滑運(yùn)動(dòng)視頻拍攝背后,是難向世人道的艱辛。
那么,人形機(jī)器人究竟難在哪里?
人形機(jī)器人的展示也人人都喜歡看,但是到底應(yīng)該看哪個(gè)部位,哪種動(dòng)作,才能判斷其中的技術(shù)含金量?
提問(wèn)五:現(xiàn)在人形機(jī)器人很多,展示也很多,普通人如何學(xué)會(huì)一眼鑒別這些人形機(jī)器人的技術(shù)含量?
陳建宇:人形機(jī)器人相關(guān)技術(shù)可以分成三部分:大腦、小腦和本體,相對(duì)而言,我認(rèn)為對(duì)于人形機(jī)器人最關(guān)鍵的是小腦,因?yàn)樗浅薪哟竽X的思考,是規(guī)劃和調(diào)用硬件本體,是真正幫助我們到物理世界里干活的的基礎(chǔ)。
另外,我認(rèn)為人形機(jī)器人的小腦相對(duì)其它兩個(gè)部分反而是最薄弱的,技術(shù)的不確定性最高,也最沒(méi)有收斂。
本體雖然也很難,但其中諸如芯片如何做,已經(jīng)有諸如機(jī)器人、電動(dòng)汽車(chē)等產(chǎn)業(yè)發(fā)展可以借鑒,對(duì)于大腦而言,我們現(xiàn)在也已經(jīng)有強(qiáng)大的大語(yǔ)言模型技術(shù),但對(duì)于小腦,我們發(fā)現(xiàn)大部分機(jī)器人現(xiàn)在用的還是十幾年前,甚至幾十年前的技術(shù)。
至于如何鑒別,我覺(jué)得非常重要的行走的泛化性,當(dāng)你在它演示過(guò)程中“搗亂”,它行走的時(shí)候你踹它一腳,抓取的時(shí)候,你突然把這個(gè)東西拿開(kāi),看它是否能夠穩(wěn)定、智能地適應(yīng)環(huán)境并完成相應(yīng)任務(wù)。
王鶴:我們最關(guān)心的是機(jī)器人上半身——手眼腦的協(xié)調(diào),這其中有大腦,有小腦,有對(duì)本體的控制。
我們的機(jī)器人首先有泛化抓取能力,這非常體現(xiàn)具身智能的泛化能力,因?yàn)榉簾o(wú)論是透明的、高光的、吸光的各種材質(zhì)的物體,我們的機(jī)器人都能抓取,諸如抱箱子、拿藥盒全都是靠視覺(jué)引導(dǎo)的泛化。
與大腦耦合時(shí),在完全沒(méi)見(jiàn)過(guò)的環(huán)境里,我們用宇樹(shù)的機(jī)器狗做了DEMO,我們的導(dǎo)航可以基于視頻輸入,在零代碼部署下進(jìn)行導(dǎo)航行走。
這是我認(rèn)為人形機(jī)器人技術(shù)含金量最高的兩個(gè)地方。
王興興:我個(gè)人希望到明年人形機(jī)器人可以做非常復(fù)雜的全身運(yùn)動(dòng)類(lèi)表演。
我們現(xiàn)在雖然也做了一部分的這樣工作,但目前大部分動(dòng)作還是單獨(dú)訓(xùn)練,而且每次訓(xùn)練還是挺花時(shí)間和人力的,如果能夠給人形機(jī)器人看一個(gè)視頻或者一個(gè)簡(jiǎn)單的演示,它就能學(xué)會(huì)一個(gè)動(dòng)作,這會(huì)讓人形機(jī)器人的表演能力發(fā)生一個(gè)翻天覆地的變化。
另外我們依然希望有更好的操作能力,無(wú)論是操作簡(jiǎn)單的桌面整理,還是做復(fù)雜的生產(chǎn)裝配,甚至更復(fù)雜的推理任務(wù),操作能力會(huì)得到極大的提升,從而真正讓人形機(jī)器人解決大部分手臂操作任務(wù)。
張巍:我認(rèn)為人形機(jī)器人的門(mén)道看兩個(gè)關(guān)鍵能力,一是泛化,二是通用。
人形機(jī)器人之所以被視為一個(gè)新物種,而不是傳統(tǒng)機(jī)械臂的延續(xù),本質(zhì)就是要長(zhǎng)出兩條腿,腿也是機(jī)器人實(shí)現(xiàn)通用能力的基礎(chǔ)。
機(jī)器人的腿主要看兩點(diǎn),一個(gè)是有是否已經(jīng)完成了諸如復(fù)雜地形行走這樣本應(yīng)該由腿足實(shí)現(xiàn)的功能;二是能否支撐雙臂完成全身協(xié)同的通用操作。
【3】問(wèn)突破:大模型讓人形機(jī)器人覺(jué)醒
2022年9月,特斯拉Optimus全球首秀,掀起了如今這波人形機(jī)器人熱潮。
不過(guò),真正將人形機(jī)器人這波浪潮推向高潮的,還有另一個(gè)關(guān)鍵因素——2022年11月ChatGPT的發(fā)布。
人工智能技術(shù)的再突破,大模型范式的興起,尤其多模態(tài)大模型能力的不斷提升,讓人形機(jī)器人的泛化性得以大幅長(zhǎng)進(jìn),正是有了這樣的時(shí)代機(jī)遇,國(guó)內(nèi)人形機(jī)器人賽道一時(shí)涌入了上百個(gè)團(tuán)隊(duì)。
人形機(jī)器人的百團(tuán)大戰(zhàn),因大模型再度開(kāi)打。
提問(wèn)六:云棲大會(huì)今年的主旋律是大模型,特別提出要超越屏幕里的AI,接引物理世界的AI,那么大模型對(duì)機(jī)器人的發(fā)展起到了怎樣的作用?
張巍:我覺(jué)得機(jī)器人這一波發(fā)展不是自我革命,而是AGI發(fā)展為機(jī)器人產(chǎn)業(yè)帶來(lái)了革命,我甚至認(rèn)為具身智能將會(huì)是多模態(tài)大模型的一個(gè)殺手級(jí)應(yīng)用,當(dāng)然我把無(wú)人駕駛也算在具身智能和機(jī)器人賽道中。
由于受到大模型技術(shù)發(fā)展的啟發(fā),機(jī)器人領(lǐng)域的發(fā)展也經(jīng)歷了從規(guī)則驅(qū)動(dòng)到算法驅(qū)動(dòng)、再到數(shù)據(jù)驅(qū)動(dòng)的一個(gè)蛻變。
之前是看你有什么算法,然后根據(jù)算法的需求收集數(shù)據(jù)來(lái)解決問(wèn)題,現(xiàn)在的思維變成了首先看你有什么數(shù)據(jù)、有多少數(shù)據(jù),你獲取新數(shù)據(jù)的方式和成本如何,這些數(shù)據(jù)的質(zhì)量分布是什么樣的,這直接決定了你采用什么樣的算法、如何去訓(xùn)練。
所以我們公司有一個(gè)口號(hào):軟件定義硬件,但數(shù)據(jù)定義軟件。
王興興:通用人形機(jī)器人是目前大模型落地最好的載體,而且可以解決大模型目前落地場(chǎng)景問(wèn)題,所以我認(rèn)為二者是一個(gè)很好的組合關(guān)系。
王鶴:我覺(jué)得現(xiàn)在通用機(jī)器人雖然有一些技能,但幾乎都是一些分立的小模型,所以大模型賦能機(jī)器人技能分幾步:
第一步,大模型可以作為一個(gè)智能體,來(lái)調(diào)用API進(jìn)行長(zhǎng)程的任務(wù)規(guī)劃;
第二步,大模型可以作為一個(gè)控制器,來(lái)監(jiān)控小模型執(zhí)行過(guò)程中有沒(méi)有出錯(cuò),及時(shí)地終止或調(diào)用其它技能來(lái)挽救這些錯(cuò)誤;
第三步,端到端視覺(jué)語(yǔ)言動(dòng)作模型將動(dòng)作作為大模型輸出模態(tài),像自動(dòng)駕駛一樣實(shí)現(xiàn)通用感知、規(guī)劃和執(zhí)行融為一體的大模型,這也是最有想象力的。
陳建宇:我認(rèn)為大模型帶給我們最重要的啟發(fā)是告訴我們有Scaling Law的存在。
我們?cè)谘芯客ㄓ脵C(jī)器人,它必須要有與它匹配的通用智能,引導(dǎo)我們思考如何做機(jī)器人的scaling Law,同時(shí)它也帶給我們一些語(yǔ)言模型領(lǐng)域技術(shù),例如基于transformer架構(gòu)、predict next token的算法技術(shù),當(dāng)然這些遠(yuǎn)遠(yuǎn)不夠,畢竟我們的機(jī)器人需要在物理世界去交互、去做事情,去理解整個(gè)物理世界。
所以不管是你的算法層面還是模型層面,還是數(shù)據(jù)層面,其實(shí)都有很多的不同,需要我們?nèi)ヌ剿鳌?/p>
具體而言,視頻數(shù)據(jù)、合成數(shù)據(jù)、真實(shí)數(shù)據(jù),人形機(jī)器人的下一個(gè)突破,需要不同數(shù)據(jù)的融合;而基于根據(jù)人形機(jī)器人未來(lái)的智能負(fù)載,也需要算力層面的云端協(xié)同。
【4】問(wèn)場(chǎng)景:人形機(jī)器人何時(shí)走入生活
人形機(jī)器人何時(shí)能夠走入人類(lèi)生活?
面對(duì)當(dāng)下的人形機(jī)器人熱潮,這是所有人最關(guān)心的問(wèn)題,我們能夠看到的是人形機(jī)器人已經(jīng)開(kāi)始進(jìn)入工廠做POC,也已經(jīng)有專(zhuān)注于家庭場(chǎng)景的人形機(jī)器人研究團(tuán)隊(duì)出現(xiàn)。
在一眾人形機(jī)器人團(tuán)隊(duì)都在思考如何推動(dòng)人形機(jī)器人產(chǎn)業(yè)落地過(guò)程中,2024年成了人形機(jī)器人進(jìn)入人類(lèi)生活的關(guān)鍵年。
提問(wèn)七:長(zhǎng)期看,人形機(jī)器人是一個(gè)多大體量的市場(chǎng)?
王鶴:銀河通用的機(jī)器人在云棲大會(huì)現(xiàn)場(chǎng)展示了在零售場(chǎng)景的應(yīng)用,剛剛同事給我發(fā)來(lái)的圖片已經(jīng)排起了10米的長(zhǎng)隊(duì),觀眾可以在我們的iPad上下單,我們的機(jī)器人就可以給大家從貨架上拿觀眾想要的東西遞給他。
其實(shí)像零售這樣主要是抓取、放置動(dòng)作的場(chǎng)景,現(xiàn)在的技術(shù)已經(jīng)到達(dá)了產(chǎn)業(yè)化的邊界,我預(yù)計(jì)明年將會(huì)是商用元年,我們的目標(biāo)是5年內(nèi)在這樣的場(chǎng)景(包括汽車(chē)工廠抱箱子)出貨達(dá)到1萬(wàn)臺(tái)。
10年是我認(rèn)為安全性可以達(dá)到進(jìn)入家庭的標(biāo)準(zhǔn),15年后將可能會(huì)形成一個(gè)千萬(wàn)乃至大幾千萬(wàn)級(jí)別的市場(chǎng)。
提問(wèn)八:人形機(jī)器人最快的干活時(shí)間點(diǎn)有多快?
陳建宇:我覺(jué)得人形機(jī)器人要能初步用起來(lái)的話,無(wú)論是工業(yè)還是商用,甚至是家用,可能都在很近的時(shí)間,例如一兩年的時(shí)間就能做一些簡(jiǎn)單工作。
根據(jù)羅杰斯的創(chuàng)新擴(kuò)散模型,任何一個(gè)產(chǎn)業(yè)都會(huì)有一些早期嘗鮮者,他們?cè)敢庠谀惝a(chǎn)品還沒(méi)有特別完善的時(shí)候嘗試使用,我相信兩年內(nèi)就能看到各行各業(yè)有一些早期使用者開(kāi)始使用。
王興興:我個(gè)人比較樂(lè)觀,我覺(jué)得明年像工業(yè)場(chǎng)景或者固定場(chǎng)景中做一些有商業(yè)價(jià)值的落地應(yīng)用已經(jīng)能夠?qū)崿F(xiàn)。
因?yàn)楝F(xiàn)在全球在機(jī)器人AI領(lǐng)域的人才、資金投入是巨量的,是過(guò)去的幾百倍乃至上千倍,我認(rèn)為三年左右至少全球范圍內(nèi)有通用型機(jī)器人AI出來(lái)的概率很大,這樣的機(jī)器人可以在包括擴(kuò)工廠、家庭中做很多事情,這樣的機(jī)器人你只要給它簡(jiǎn)單做個(gè)示范,它就可以學(xué)會(huì)相應(yīng)的工作。
張巍:首先我認(rèn)為用時(shí)間衡量是一個(gè)比較難的事,我認(rèn)為產(chǎn)業(yè)發(fā)展應(yīng)該是事件驅(qū)動(dòng),而不是時(shí)間驅(qū)動(dòng),它更關(guān)鍵的是看人工智能技術(shù)的“關(guān)鍵開(kāi)關(guān)”什么時(shí)候能找到。
雖然我也是比較樂(lè)觀的,但我們?cè)诒苊膺^(guò)早地做商業(yè)化,GPT在2.0或3.0的時(shí)候你想做個(gè)超級(jí)應(yīng)用,一定要打一堆補(bǔ)丁,因?yàn)樯弦淮斯ぶ悄芎蜋C(jī)器人落地的過(guò)程中也遇到了很多這種挑戰(zhàn),大家當(dāng)時(shí)都在調(diào)侃“人工智能等于智能不夠靠人工”,是靠增加部署和售后的成本才能跑通商業(yè)邏輯。
提問(wèn)九:人形機(jī)器人何時(shí)能敲門(mén)進(jìn)屋,走進(jìn)客廳?
陳建宇:不需要太久,現(xiàn)在我們的機(jī)器人已經(jīng)能夠?qū)崿F(xiàn)上下樓梯,在戶(hù)外進(jìn)行導(dǎo)航,已經(jīng)完全可以了,它完全可以自主導(dǎo)航到你家門(mén)口執(zhí)行敲門(mén)動(dòng)作。
這個(gè)沒(méi)有難度,難的是如果大規(guī)模應(yīng)用,進(jìn)入家庭一定需要很長(zhǎng)時(shí)間,因?yàn)榧彝ナ且粋€(gè)沒(méi)有邊界的場(chǎng)景,對(duì)泛化能力要求很高,人形機(jī)器人一定會(huì)先在工業(yè)場(chǎng)景這種有邊界或可以人為制定一些規(guī)則的場(chǎng)景落地。
【5】能、能、能、能
在對(duì)話的結(jié)尾,主持人問(wèn)了四位嘉賓最后一個(gè)問(wèn)題,也是直接呼應(yīng)對(duì)話主題的問(wèn)題。那就是“人形機(jī)器人,會(huì)不會(huì)接棒聊天機(jī)器人,在物理世界有一天突破圖靈測(cè)試,完全融入我們的工作和生活,與人類(lèi)難分彼此?”。
四位嘉賓或許在之前的提問(wèn)中,觀點(diǎn)還有所差異,但是在這個(gè)最本質(zhì)的問(wèn)題上,都是斬釘截鐵的一個(gè)字“能!”。
顯然,人形機(jī)器人如今在全球已經(jīng)形成了一個(gè)勢(shì)不可擋的熱潮,國(guó)內(nèi)這一賽道也已經(jīng)涌現(xiàn)出了上百個(gè)人形機(jī)器人團(tuán)隊(duì),這一領(lǐng)域經(jīng)歷著又一輪百團(tuán)大戰(zhàn)。
作為一年一度的全球科技盛會(huì),今年的云棲大會(huì)在前沿展館特別開(kāi)辟了人形機(jī)器人先進(jìn)陣列展區(qū),包括特斯拉Optimus、宇樹(shù)科技H1、星動(dòng)紀(jì)元小星、銀河通用Galbot G1、逐際動(dòng)力CL-2、優(yōu)寶特行者泰山等一系列明星產(chǎn)品都在云棲大會(huì)亮相,并與觀眾進(jìn)行了一系列互動(dòng)演示。
圓桌嘉賓的四個(gè)“能”字,和現(xiàn)場(chǎng)的人頭攢動(dòng),也相繼成了今年人形機(jī)器人熱潮的絕佳縮影。
至頂科技CEO兼總編輯高飛在圓桌討論最后總結(jié)稱(chēng),“計(jì)算機(jī)科學(xué)家艾倫·凱曾經(jīng)講過(guò)一句話,預(yù)測(cè)未來(lái)的最好方法就是發(fā)明它,相信在座的各位作為人形機(jī)器人領(lǐng)域主要推動(dòng)力,會(huì)和更多生態(tài)創(chuàng)新力量一起攜手,一定可以共同創(chuàng)造一個(gè)美好的,人機(jī)協(xié)同的——機(jī)器人新紀(jì)元。”
值得注意的是,就在云棲上人形機(jī)器人這一顛覆對(duì)話結(jié)束時(shí),還特別增設(shè)了一個(gè)獨(dú)特的環(huán)節(jié)——四家明星企業(yè)展區(qū)的人形機(jī)器人和臺(tái)上的四位創(chuàng)始人面向觀眾揮手致意。
這一幕,注定將載入云棲史冊(cè),也將載入世界人形機(jī)器人發(fā)展史。