這年頭,人形機(jī)器人都有清華的學(xué)士帽戴!
(資料圖片)
這位走出清華二校門的機(jī)器人,簡直要把門口參加暑期研習(xí)營的小孩們饞哭了。
不僅擁有清華紫學(xué)士帽,在剛剛結(jié)束的WAIC“具身通用人工智能”論壇上,這個(gè)名叫小星的人形機(jī)器人,還和圖靈獎(jiǎng)得主、中國科學(xué)院院士姚期智合影貼貼。
是誰羨慕了?我不說。
小星這“人”,出自清華大學(xué)交叉信息研究院(IIIS)陳建宇團(tuán)隊(duì),整機(jī)結(jié)構(gòu)、電機(jī)、減速器、驅(qū)動(dòng)器、步態(tài)算法等機(jī)器人軟硬件將通通自研。
陳建宇,31歲的清華叉院助理教授,28歲時(shí),就已經(jīng)以叉院博導(dǎo)的身份走在從教之路上。
博士畢業(yè)于UC伯克利,本科就讀于清華大學(xué)精密儀器系,研究領(lǐng)域包括機(jī)器人學(xué)、強(qiáng)化學(xué)習(xí)、自動(dòng)駕駛等。
01 人形機(jī)器人小星
一起來認(rèn)識一下,這位青年博導(dǎo)“教”出來的人形機(jī)器人——
體重28kg,身高1.2m,加上雙手后,全身上下具有34個(gè)自由度。
在行走方面,小星在不同類型的地面上都可以穩(wěn)步前進(jìn),比如落滿枯葉的林間小道:
或者是公園花壇旁的水泥上坡路:
腳下的地皮換成草坪,也不妨礙它踏步前進(jìn):
總之就走得還挺穩(wěn)的,速度也還不錯(cuò)。
與此同時(shí),它還能利用雙手提供一些服務(wù)功能,遞個(gè)燒烤、端杯咖啡什么的:
在液壓驅(qū)動(dòng)和電機(jī)驅(qū)動(dòng)二者之間,小星采用了成本優(yōu)勢更高的后者。
為了研發(fā)高性能、低成本的人形機(jī)器人,團(tuán)隊(duì)堅(jiān)持最新一代的準(zhǔn)直驅(qū)力控方案,用高扭矩密度電機(jī)搭配低減速比減速器,用電流環(huán)直接力控搭配動(dòng)態(tài)雙足行走算法。
這種方案對電機(jī)扭矩要求極高,因此團(tuán)隊(duì)也一直在探究新的電機(jī)設(shè)計(jì)方案。
目前所研制的電機(jī)扭矩密度已達(dá)到了30Nm/kg,是TQ電機(jī)(目前工業(yè)界最強(qiáng))的兩倍以上。
如此一來,無論是行走還是擺臂動(dòng)作,小星都能保持在一個(gè)比較靈活的狀態(tài)。
不過,陳建宇也坦然表示,目前小星機(jī)器人硬件上搭載的算法智能性還不夠高,小星的現(xiàn)階段表現(xiàn),還沒有發(fā)揮硬件可以支持的極限。
因此,團(tuán)隊(duì)的另一項(xiàng)主要工作就是推進(jìn)前沿的機(jī)器人智能算法,目前走的是動(dòng)力學(xué)模型+優(yōu)化控制和物理仿真+強(qiáng)化學(xué)習(xí)這兩條機(jī)器人領(lǐng)域最前沿的路徑。
相比于傳統(tǒng)的機(jī)器人算法,二者都更為通用,并且可以更多地利用動(dòng)力學(xué)來提高性能。
這兩大方法也是陳建宇博士期間的主攻研究方向。
2017年,陳建宇提出了一系列實(shí)時(shí)軌跡優(yōu)化算法并成功應(yīng)用于無人車上。
從2018年起,陳建宇的研究重點(diǎn)轉(zhuǎn)向了更為前瞻的方法——深度強(qiáng)化學(xué)習(xí)算法。在這一階段,他做出了領(lǐng)域內(nèi)較早的幾個(gè)基于自學(xué)習(xí)方法的復(fù)雜道路環(huán)境自動(dòng)駕駛工作。
“從數(shù)學(xué)上來說,無人車也是一類機(jī)器人,我們研究的算法對于無人車和機(jī)器人來說都是通用的。” 陳建宇表示,在無人車時(shí)期關(guān)于強(qiáng)化學(xué)習(xí)的經(jīng)驗(yàn),不少都可以遷移到人形機(jī)器人的研究上,“當(dāng)然,無人車和人形機(jī)器人的關(guān)注點(diǎn)不全相同,比如無人車在底層控制方面相對簡單,而對上層的決策規(guī)劃和交互等關(guān)注較多”。
通過強(qiáng)化學(xué)習(xí)結(jié)合人體運(yùn)動(dòng)數(shù)據(jù),小星在高精度物理仿真中學(xué)會(huì)了高度擬人的步態(tài)行走:
還能挖掘出硬件的極限性能,達(dá)到4m/s的奔跑速度:
除了靈活的雙腿,小星的雙手也很靈巧。
通過大規(guī)模并行仿真強(qiáng)化學(xué)習(xí)訓(xùn)練,小星學(xué)會(huì)操控其二十多個(gè)自由度的雙臂靈巧手來完成各類任務(wù)。
此外,為了協(xié)調(diào)小星手腳之間的協(xié)同工作,團(tuán)隊(duì)還提出了一種分布式技能學(xué)習(xí)算法。
“我想,人形機(jī)器人是所有機(jī)器人學(xué)家的夢想!”從本科起,陳建宇就開始關(guān)注雙足步態(tài)算法,他的本科畢業(yè)設(shè)計(jì),做的就是雙足機(jī)器人落腳點(diǎn)規(guī)劃。
2020年畢業(yè)回國,在探索過無人車、機(jī)械臂、機(jī)器狗后,于2021年底開始構(gòu)思籌劃研發(fā)自己的人形機(jī)器人。
籌備了半年,想通了技術(shù)路徑,也就是去年春夏之交,陳建宇開啟了自己的新目標(biāo):
打造人形通用機(jī)器人,以及搭載在上面的“通用智能”。
02 具身通用人工智能
目前人形機(jī)器人存在的技術(shù)難題是什么?陳建宇總結(jié)了最受關(guān)注的三個(gè)方面:
首先,由于人形機(jī)器人具備高度集成性和復(fù)雜性,硬件本體構(gòu)建具有較高挑戰(zhàn)性;
其次是運(yùn)動(dòng)小腦的構(gòu)建,如何控制雙腿行走和操控雙臂完成各種任務(wù),還未被很好解決;
最后是人形機(jī)器人的“大腦”,如何將目前只有語言功能的大模型拓展到物理世界,并讓其進(jìn)行行為決策,是實(shí)現(xiàn)具身通用智能體至關(guān)重要的一環(huán)。
——這就引出近期最火的技術(shù)話題之一,具身智能。
5月的ITF World 2023半導(dǎo)體大會(huì)上,黃仁勛在演講中明確表態(tài),下一波AI浪潮就是具身智能(Embodied Intelligence)。
所謂具身智能,就是能夠理解、推理并與物理世界互動(dòng)的智能系統(tǒng),可以理解為有身體,并支持物理交互的AI智能體。
而具身智能的終極目標(biāo),就是具身通用人工智能。以ChatGPT為代表的通用人工智能雖然帶來了極大的轟動(dòng),但其只有語言與文本處理的能力。未來我們一定需要更加有用的具身的通用人工智能。
7月WAIC的具身通用人工智能論壇,邀請了包括姚期智先生、Sergey Levine、Anca Dragan、Koushil Sreenath、Jiajun Wu等國內(nèi)外知名大咖學(xué)者一起探討具身AGI的未來,內(nèi)容涵蓋決策控制、感知認(rèn)知、本體構(gòu)建、算力支持、大模型理論等。
小星也在論壇上進(jìn)行了現(xiàn)場首秀,獲得了大量關(guān)注。
國際上,一些團(tuán)隊(duì)已在這個(gè)方向上有了初步的成果:
今年年初,谷歌推出5620億參數(shù)的多模態(tài)具身視覺語言模型PaLM-E,可以執(zhí)行各種復(fù)雜的機(jī)器人指令而無需重新訓(xùn)練。
哪怕受到干擾,也能完成“幫忙從抽屜里拿薯片”的指令。
李飛飛團(tuán)隊(duì)也新近發(fā)布了具身智能最新成果,大模型接入機(jī)器人,把復(fù)雜指令轉(zhuǎn)化成具體行動(dòng)規(guī)劃,無需額外數(shù)據(jù)和訓(xùn)練。
人類可以很隨意地用自然語言給機(jī)器人下達(dá)指令,如“打開上面的抽屜,小心花瓶!”
陳建宇團(tuán)隊(duì)也在推進(jìn)這方面的研究工作。
并且做出了世界上第一篇大模型結(jié)合人形機(jī)器人的學(xué)術(shù)工作。
他們用大模型來指導(dǎo)小星的上層任務(wù)規(guī)劃,用強(qiáng)化學(xué)習(xí)來獲取小星的底層控制器。
與此同時(shí),還提出了一套新的框架來解決上層規(guī)劃和下層執(zhí)行之間的對齊問題,以確保下層控制能很好地執(zhí)行上層規(guī)劃的任務(wù)。
“我們發(fā)現(xiàn),一些簡單的操作場景,接入13B的開源模型就比較夠用了?!标惤ㄓ罘窒砹藢?shí)驗(yàn)過程中的發(fā)現(xiàn),“作為定位家庭服務(wù)的機(jī)器人,對數(shù)理邏輯、推演等功能的要求并不太高。”
緊接著,量子位又把“大模型幻覺在具身智能身上的解決思路”這個(gè)問題拋給了陳建宇。
比起網(wǎng)絡(luò)世界里的胡說八道,現(xiàn)實(shí)世界人形機(jī)器人受到帶有幻覺的指令,似乎是一件更為嚴(yán)肅、需要正視的事情。
思考片刻后,陳建宇給出了他的答案,那就是可能需要兩手解決方案,一方面是大模型產(chǎn)品本身對幻覺的控制,另一方面,在底層的控制也要加強(qiáng)。
之前我在研究無人車對安全性的要求時(shí),會(huì)設(shè)計(jì)一些方案提升無人車的行為安全,具身智能也可以采取相同的思路,在機(jī)器人收到“不安全”的指令時(shí),及時(shí)識別,更改到安全區(qū)域范圍。
所以,添加一個(gè)完全基于物理規(guī)律,類似于安全護(hù)盾的底層保護(hù)層,或許是不錯(cuò)的辦法~
Copyright @ 2015-2022 亞洲晚報(bào)網(wǎng)版權(quán)所有 備案號: 京ICP備2021034106號-51 聯(lián)系郵箱:5 516 538 @qq.com