4月19日,雨后的北京分外清涼,人形機(jī)器人半程馬拉松吸引眾多目光。當(dāng)天10時(shí)11分左右,首個(gè)人形機(jī)器人半程馬拉松迎來(lái)首位撞線“選手”——天工Ultra,用時(shí)2小時(shí)40分42秒。

天工Ultra身高180cm,體重55kg,具備開(kāi)源開(kāi)放性和兼容擴(kuò)展性,可以靈活擴(kuò)展軟、硬件等功能模塊,已具備帶有視覺(jué)感知的泛化移動(dòng)能力,能輕松應(yīng)對(duì)溝壑、大高度差等復(fù)雜地形。

北京人形機(jī)器人創(chuàng)新中心首席技術(shù)官(CTO)唐劍。受訪者供圖


天工Ultra由北京人形機(jī)器人創(chuàng)新中心研發(fā)。北京人形機(jī)器人創(chuàng)新中心首席技術(shù)官(CTO)唐劍談及天工奪冠表示,“天工整體表現(xiàn)是非常符合預(yù)期的,主要是指它的整體速度以及完成時(shí)間。也不用避諱,大家都看到天工中途有一次摔跤,那是因?yàn)殡姵厥В@也是偶爾會(huì)出現(xiàn)的故障”。

唐劍介紹,這次比賽主要是對(duì)機(jī)器人的硬件以及軟件的運(yùn)動(dòng)算法,或者說(shuō)機(jī)器人的“小腦” 穩(wěn)定性、可靠性的一次極限的測(cè)試。天工機(jī)器人的“小腦”也是國(guó)地共建具身智能機(jī)器人創(chuàng)新中心“慧思開(kāi)物”平臺(tái)的一部分,測(cè)試是一個(gè)長(zhǎng)期的過(guò)程。

唐劍認(rèn)為,目前具身智能的ChatGPT時(shí)刻還沒(méi)有到,需要對(duì)機(jī)器人模型的架構(gòu)能力升級(jí),進(jìn)行顛覆式的升級(jí)。年中機(jī)器人自主導(dǎo)航將有突破,明年人形機(jī)器人馬拉松將不需要領(lǐng)跑員。希望人形機(jī)器人走入工業(yè)、商業(yè)、生活場(chǎng)景,能夠7X24小時(shí)不間斷穩(wěn)定地工作。


4月19日,首個(gè)人形機(jī)器人半程馬拉松,天工Ultra首個(gè)沖線。新京報(bào)記者 李木易 攝


表現(xiàn)符合預(yù)期


新京報(bào)貝殼財(cái)經(jīng):本次天工Ultra的表現(xiàn)是否符合預(yù)期?

唐劍:天工整體表現(xiàn)還是非常不錯(cuò)的,主要是指它的整體速度以及完成時(shí)間。大家看到天工中途有一次摔跤,那是因?yàn)殡姵貨](méi)電了,換電后很快便恢復(fù)了奔跑狀態(tài)。本次全程只用了同一臺(tái)機(jī)器人便完成了整個(gè)半程馬拉松比賽。

新京報(bào)貝殼財(cái)經(jīng):電池更換次數(shù)能更少?

唐劍:我們特別希望一臺(tái)機(jī)器人完成全程,電池?fù)Q了三次,一塊電池大概能跑六七公里。我們對(duì)電池容量、電量的選擇斟酌再三,做了很多測(cè)試,現(xiàn)在用的是15安的電池,如果加大加倍,更換電次數(shù)會(huì)減少一倍,但會(huì)增加機(jī)器人的重量,可能影響速度以及步態(tài)。目前是平衡各方面因素最終做一個(gè)最優(yōu)的選擇。

新京報(bào)貝殼財(cái)經(jīng):賽場(chǎng)上天工Ultra如何完成比賽?

唐劍:我們的機(jī)器人前面是有一位領(lǐng)跑者,這是無(wú)線跟隨技術(shù),是一種半自主的,不用遙控器方式。領(lǐng)跑者是一位運(yùn)動(dòng)員,身上有UWB標(biāo)簽,機(jī)器人身上有無(wú)線的發(fā)射器,負(fù)責(zé)發(fā)射無(wú)線信號(hào)并且回收,然后利用算法與領(lǐng)跑者保持相對(duì)固定的距離和角度,實(shí)現(xiàn)運(yùn)動(dòng)。然后后面兩個(gè)人員主要是起到保護(hù)作用。

新京報(bào)貝殼財(cái)經(jīng):為完成本次比賽做了哪些準(zhǔn)備?

唐劍:天工在備賽過(guò)程中做了大量訓(xùn)練和測(cè)試,還要去做極限測(cè)試,并針對(duì)各種復(fù)雜地形進(jìn)行測(cè)試,以及還有跟隨算法的測(cè)試。

為了奪冠軟硬兼施

新京報(bào)貝殼財(cái)經(jīng):天工奪冠主要原因是什么??jī)?yōu)勢(shì)有哪些?


唐劍:在硬件方面,首先為天工的“本體”做了輕量化和低慣量的設(shè)計(jì),盡量減重,同時(shí)把踝關(guān)節(jié)以及膝關(guān)節(jié)盡量往上提升,讓腿部的慣量比較低,腿部跑起來(lái)比較輕盈;其次,對(duì)一些關(guān)節(jié)模組的導(dǎo)熱設(shè)計(jì)做了優(yōu)化,讓它能很快達(dá)到熱平衡,而不是讓關(guān)節(jié)的溫度持續(xù)上升,因?yàn)樯仙揭欢囟龋@個(gè)關(guān)節(jié)會(huì)失效,這樣機(jī)器人會(huì)摔倒;第三,在腳底做了一些緩沖的設(shè)計(jì),盡可能減少對(duì)關(guān)節(jié)膜、對(duì)腳底板以及關(guān)節(jié)模組的磨損。更重要的是,天工的腿比其他賽隊(duì)的機(jī)器人要長(zhǎng),跑得比較快。

在軟件方面,運(yùn)控算法做了很多優(yōu)化。一是要在步頻、步幅、步態(tài)上做非常平衡的最優(yōu)選擇。二是奔跑的算法用了最先進(jìn)的強(qiáng)化模擬學(xué)習(xí)。強(qiáng)化模擬學(xué)習(xí)是要模仿人類,試采人類運(yùn)動(dòng)員跑步的數(shù)據(jù),讓它盡可能接近運(yùn)動(dòng)員。因?yàn)槿祟愡M(jìn)化了千年,跑步跑得快一定是有它的道理,我們把采集到的人的數(shù)據(jù)導(dǎo)入到強(qiáng)化學(xué)習(xí)的架構(gòu)中。

新京報(bào)貝殼財(cái)經(jīng):本次比賽展現(xiàn)了哪些技術(shù)優(yōu)勢(shì)?

唐劍:這次比賽主要是對(duì)機(jī)器人的硬件以及軟件的運(yùn)動(dòng)算法,或者說(shuō)機(jī)器人的“小腦” 穩(wěn)定性、可靠性的一次極限的測(cè)試。天工機(jī)器人的“小腦”也是北京人形機(jī)器人創(chuàng)新中心“慧思開(kāi)物”平臺(tái)的一部分,測(cè)試是一個(gè)長(zhǎng)期的過(guò)程。

今年3月12日,我們發(fā)布“慧思開(kāi)物”的平臺(tái),這是一個(gè)一腦多能、一腦多機(jī)的通用具身智能平臺(tái),這個(gè)軟件平臺(tái)最主要功能是支持其他機(jī)器人應(yīng)用開(kāi)發(fā)商以及系統(tǒng)集成商基于該平臺(tái)開(kāi)發(fā)應(yīng)用,平臺(tái)上有非常強(qiáng)大的AI的能力。

AI的強(qiáng)化學(xué)習(xí)屬于實(shí)戰(zhàn)派,算法開(kāi)始可能是個(gè)小白,放到實(shí)際環(huán)境中不斷試錯(cuò),起初可能會(huì)摔倒,跑得很慢,跌跌撞撞。然后它在訓(xùn)練過(guò)程中不斷地試錯(cuò),越來(lái)越強(qiáng)。強(qiáng)化學(xué)習(xí)的最大優(yōu)勢(shì)是泛化能力比較強(qiáng)。實(shí)戰(zhàn)派遇到什么情況都可以應(yīng)付。在奔跑過(guò)程中,可能會(huì)遇到轉(zhuǎn)彎、上坡、下坡以及坑洼地滑等等,都有比較好的應(yīng)對(duì)。

具身智能的ChatGPT時(shí)刻還沒(méi)有到

新京報(bào)貝殼財(cái)經(jīng):機(jī)器人如何泛化?

唐劍:泛化能力與大模型的泛化能力有類似的地方,一是數(shù)據(jù),但數(shù)據(jù)的增多也不一定能完全解決。現(xiàn)在大模型已經(jīng)展現(xiàn)出比較強(qiáng)大的泛化能力了,但是機(jī)器人的操作和語(yǔ)言,與語(yǔ)言大模型不同。目前具身智能很大程度上照搬了語(yǔ)言大模型。機(jī)器人模型的結(jié)構(gòu)和架構(gòu),可能也需要比較顛覆式的突破和進(jìn)展,可能不只是數(shù)據(jù)的堆疊和積累。可以認(rèn)為是目前具身智能的ChatGPT時(shí)刻還沒(méi)有到。

新京報(bào)貝殼財(cái)經(jīng):機(jī)器人對(duì)物理世界的認(rèn)知還是有限?

唐劍:是的。泛化能力有兩方面,一是大腦的規(guī)劃能力,這有非常大的難點(diǎn),要學(xué)習(xí)物理的規(guī)律。看到物品后需要大腦規(guī)劃如何操作,這個(gè)比較難,要比較強(qiáng)大的泛化能力。

還有手部操作也要比較強(qiáng)大的泛化能力,進(jìn)入家庭生活場(chǎng)景,光照、桌子、窗簾等紋理都不一樣,如何操作是難點(diǎn),比方杯子類型豐富多樣,是否有模型可無(wú)差別拿起杯子,可能不單單是數(shù)據(jù)的積累,可能需要對(duì)模型的架構(gòu)能力升級(jí),甚至是顛覆式的升級(jí),這可能比較重要。

希望機(jī)器人能夠7X24小時(shí)不間斷穩(wěn)定地工作

新京報(bào)貝殼財(cái)經(jīng):后續(xù)技術(shù)如何迭代?

唐劍:我們會(huì)非常關(guān)注產(chǎn)業(yè)化的落地,第一階段先開(kāi)始在工業(yè)和泛工業(yè)場(chǎng)景做一些巡檢類及簡(jiǎn)單的操作類的工作。第二階段會(huì)在商業(yè)的場(chǎng)景提供商業(yè)服務(wù),完成打包、掃碼等相對(duì)比較復(fù)雜的操作。第三階段會(huì)走入生活和家庭,去扮演像保姆、管家等角色。

最終希望人形機(jī)器人走入工業(yè)、商業(yè)、生活場(chǎng)景,能夠7X24小時(shí)不間斷穩(wěn)定地工作,這是參加這次比賽的重要目的,我們會(huì)持續(xù)迭代不斷提升。同時(shí)也有一系列的研發(fā)計(jì)劃,會(huì)去占領(lǐng)具身智能技術(shù)制高點(diǎn)。

新京報(bào)貝殼財(cái)經(jīng):具體有哪些技術(shù)需要迭代?

唐劍:比如像這次馬拉松比賽,大家可能覺(jué)得自主導(dǎo)航是很成熟的技術(shù),但也不盡然。自主導(dǎo)航在自動(dòng)駕駛上是開(kāi)發(fā)了非常多年,相對(duì)比較成熟。但人形機(jī)器人全身的關(guān)節(jié)很多,控制完全不是一個(gè)層次,控制復(fù)雜度是幾何級(jí)數(shù)的增長(zhǎng)。

人形機(jī)器人的自主導(dǎo)航在產(chǎn)業(yè)界沒(méi)有比較標(biāo)準(zhǔn)的參考性設(shè)計(jì),自動(dòng)駕駛的算法也絕對(duì)不可能直接應(yīng)用到機(jī)器人上。比如路徑規(guī)劃的算法,可能可以借鑒自動(dòng)駕駛的算法,但機(jī)器人能非常完美遵循規(guī)劃軌跡其實(shí)極其難,這個(gè)是非常大的難點(diǎn)。我們目前正在攻關(guān)這個(gè)難點(diǎn)。

已小批量生產(chǎn) 很快會(huì)具備自主導(dǎo)航能力

新京報(bào)貝殼財(cái)經(jīng):這個(gè)機(jī)器人已經(jīng)實(shí)現(xiàn)量產(chǎn)了嗎?

唐劍:我們會(huì)有天工2.0機(jī)器人很快實(shí)現(xiàn)小批量生產(chǎn),并且開(kāi)始逐步投入一些場(chǎng)景的應(yīng)用。

新京報(bào)貝殼財(cái)經(jīng):2.0是Ultra版本嗎?

唐劍:不是的,Ultra版本是運(yùn)動(dòng)型的機(jī)器人,最明顯特征腿比較長(zhǎng),主要是為提升運(yùn)動(dòng)性能。天工2.0也有不同的版本,有七軸機(jī)械臂帶五指靈巧手的,能更好支持上肢具身智能相關(guān)的操作。

新京報(bào)貝殼財(cái)經(jīng):明年是否還會(huì)參加機(jī)器人馬拉松?是否還需要領(lǐng)跑員與陪護(hù)員?

唐劍:我們很快會(huì)具備自主導(dǎo)航能力,現(xiàn)在已經(jīng)在研發(fā),很快就能展示出全自主的導(dǎo)航。這樣天工將不再需要人類引導(dǎo)參加馬拉松,明年的機(jī)器人馬拉松有望看到無(wú)人引導(dǎo)的天工在奔跑。

新京報(bào)貝殼財(cái)經(jīng)記者 陳維城
編輯 徐倩
校對(duì) 王心