【ZiDongHua 之人文化天下收錄關(guān)鍵詞: 機(jī)器人 人工智能 大模型】
  
  宇樹(shù):人形機(jī)器人開(kāi)啟具身智能新紀(jì)元
 
 
  
  “人形機(jī)器人不僅將擁有超越四足機(jī)器人的巨大潛力,更是實(shí)現(xiàn)具身智能落地的最佳硬件載體。”這是杭州宇樹(shù)科技有限公司(以下簡(jiǎn)稱宇樹(shù))聯(lián)合創(chuàng)始合伙人陳立的判斷。
  
  在科技發(fā)展的浪潮中,人形機(jī)器人作為智能科技的杰出代表,正逐步從實(shí)驗(yàn)室走進(jìn)我們的生活。近日,《企業(yè)家》雜志就人形機(jī)器人的研發(fā)與應(yīng)用前景采訪了陳立。他不僅分享了宇樹(shù)在四足機(jī)器人領(lǐng)域的開(kāi)創(chuàng)性成果,更對(duì)人形機(jī)器人的上限、發(fā)展?jié)摿σ约懊媾R的挑戰(zhàn)提出了獨(dú)到見(jiàn)解。
  
  《企業(yè)家》雜志
  
  弘揚(yáng)企業(yè)家精神  傳播管理智慧
  
 
  
  陳立
  
  杭州宇樹(shù)科技有限公司聯(lián)合創(chuàng)始合伙人
  
  01
  
  上限遠(yuǎn)高于四足機(jī)器人
  
  《企業(yè)家》:宇樹(shù)在2023年8月,僅用半年時(shí)間發(fā)布了全尺寸通用人形機(jī)器人 Unitree H1。作為全球四足機(jī)器人行業(yè)的開(kāi)創(chuàng)者,您在研發(fā)過(guò)程中感受最深的是什么?
  
  陳立:回顧整個(gè)Unitree H1的開(kāi)發(fā)過(guò)程,我印象最深刻的有三點(diǎn)。第一,這款H1定位于在工業(yè)場(chǎng)景中承擔(dān)“吃苦耐勞”的功能,對(duì)各方面要求非常高。因此,要開(kāi)發(fā)一款人形機(jī)器人產(chǎn)品,必須對(duì)它的可靠性、穩(wěn)定性更具前瞻性。
  
  第二,我們采用了小步快跑的方式進(jìn)行迭代。從H1 1.0學(xué)會(huì)走路、H1 2.0學(xué)會(huì)搬運(yùn)物體及對(duì)地形的適應(yīng)能力到H1 3.0奔跑速度達(dá)3.3m/s,再到H1 4.0實(shí)現(xiàn)了后空翻動(dòng)作,這一系列功能的完成不是一蹴而就的,而是逐步遞進(jìn)的。
  
  第三,底層技術(shù)積累至關(guān)重要。宇樹(shù)的四足機(jī)器人核心零部件如電機(jī)、減速器、電機(jī)驅(qū)動(dòng)器、編碼器、傳感器、主控甚至電池都采用自研,將四足機(jī)器人的相關(guān)技術(shù)遷移到人形機(jī)器人上,對(duì)宇樹(shù)來(lái)說(shuō)也是理所當(dāng)然的。雖然人形機(jī)器人與四足機(jī)器人是完全不同的兩個(gè)產(chǎn)品,技術(shù)上比四足機(jī)器人更有難度,但它們之間的底層邏輯是相通的。只有掌握了核心技術(shù),才能在產(chǎn)品上發(fā)揮出超乎預(yù)期的能量。
  
  《企業(yè)家》:人形機(jī)器人與四足機(jī)器人的區(qū)別是什么?從四足到人形,宇樹(shù)面臨的最大挑戰(zhàn)是什么?
  
  陳立:從現(xiàn)階段來(lái)看,四足機(jī)器人在產(chǎn)品穩(wěn)定性、可靠性和負(fù)載能力等方面展現(xiàn)出了比人形機(jī)器人更卓越的性能。但是從潛力來(lái)看,人形機(jī)器人或許具有更大的優(yōu)勢(shì)。由于人形機(jī)器人的形態(tài)、關(guān)節(jié)設(shè)計(jì)等與人類高度相似,它更易于適應(yīng)和融入人類的生活及工作場(chǎng)景,比如進(jìn)行烹飪、操作工具(電鉆、螺絲刀等),甚至駕駛汽車(chē)等復(fù)雜任務(wù)。
  
  從四足機(jī)器人發(fā)展到人形機(jī)器人,我們面臨的最大挑戰(zhàn)在于后者需要適應(yīng)更多樣化的環(huán)境和任務(wù),無(wú)論是家庭服務(wù)、工業(yè)生產(chǎn)還是公共服務(wù)領(lǐng)域,人形機(jī)器人都需要展現(xiàn)出高度的靈活性和適應(yīng)性。這意味著它不僅要具備強(qiáng)大的感知和認(rèn)知能力,以理解和響應(yīng)各種復(fù)雜場(chǎng)景,還需要擁有卓越的運(yùn)動(dòng)控制和操作能力,以執(zhí)行各種復(fù)雜的任務(wù)。
  
  與四足機(jī)器人相比,人形機(jī)器人的復(fù)雜性大大增加,需要考慮其可靠性、穩(wěn)定性、成本、續(xù)航能力以及運(yùn)動(dòng)控制的復(fù)雜性。比如,四足機(jī)器人只有12個(gè)關(guān)節(jié)電機(jī)(即12個(gè)自由度),而宇樹(shù)最新的G1人形機(jī)器人擁有43個(gè)自由度,電機(jī)數(shù)量是四足機(jī)器人的3到4倍。
  
  目前,我們的核心業(yè)務(wù)仍然是以四足機(jī)器人為主。但伴隨人形機(jī)器人的快速發(fā)展,它在公司業(yè)務(wù)中的比重將會(huì)逐步增大,甚至有望超過(guò)四足機(jī)器人。
  
  02
  
  實(shí)現(xiàn)具身智能最好的形態(tài)
  
  《企業(yè)家》:人形機(jī)器人是實(shí)現(xiàn)具身智能最好的形態(tài)嗎?
  
  陳立:是的。人形機(jī)器人是實(shí)現(xiàn)具身智能落地的最佳載體。因?yàn)榫呱碇悄苌婕岸喾N感知和控制,類似于人類的視覺(jué)、聽(tīng)覺(jué)、嗅覺(jué)、觸覺(jué)以及大腦和小腦的功能等。人形機(jī)器人也具有類似的結(jié)構(gòu),大腦負(fù)責(zé)認(rèn)知和感知,小腦負(fù)責(zé)運(yùn)動(dòng)控制,可以完成各種任務(wù)和動(dòng)作。
  
  具身智能還包括手和腳的靈巧操作,以及快速的運(yùn)動(dòng)能力。具身智能的訓(xùn)練成果可以直接遷移到人形機(jī)器人身上,實(shí)現(xiàn)無(wú)縫對(duì)接。
  
  《企業(yè)家》:人形機(jī)器人非常依賴AI大模型的發(fā)展嗎?
  
  陳立:是的。幾年前,人工智能的發(fā)展被認(rèn)為已經(jīng)到達(dá)瓶頸。這是因?yàn)槿斯ぶ悄艿姆夯芰Σ蛔?,無(wú)法實(shí)現(xiàn)舉一反三,只能回答特定問(wèn)題,無(wú)法進(jìn)行更深入的對(duì)話。
  
  然而,隨著大模型的出現(xiàn),人工智能的泛化能力得到了顯著提升。例如,使用ChatGPT進(jìn)行對(duì)話時(shí),它能夠根據(jù)針對(duì)性的問(wèn)題進(jìn)行有條理的回答,提供了更好的用戶體驗(yàn)。這主要得益于AI大模型的強(qiáng)大泛化能力。
  
 
  
  △Unitree G1 具有超越常人的靈活性,擁有超大關(guān)節(jié)遠(yuǎn)動(dòng)角度空間,能夠完成更加精準(zhǔn)和靈活的動(dòng)作。
  
  對(duì)于人形機(jī)器人來(lái)說(shuō),面臨的任務(wù)是多樣且復(fù)雜的,需要它具備更強(qiáng)的泛化能力。比如,讓人形機(jī)器人在桌子上擺放西紅柿、菜刀和砧板,完成握住菜刀切西紅柿等任務(wù),這需要它具備更高的泛化能力才能完成。
  
  AI大模型讓人形機(jī)器人進(jìn)入千家萬(wàn)戶提供了巨大的可能性。在AI大模型尚未成熟之前,人形機(jī)器人的應(yīng)用可能僅限于工廠中的特定工序,完成一些簡(jiǎn)單且重復(fù)性的工作,這與現(xiàn)有的機(jī)械臂并無(wú)太大差異。
  
  然而,隨著AI大模型的發(fā)展,人形機(jī)器人的功能和應(yīng)用范圍得到了極大的拓展。它不再局限于簡(jiǎn)單的工廠工作,而是能夠勝任更加復(fù)雜、多樣化的任務(wù)。這是因?yàn)锳I大模型賦予了它強(qiáng)大的泛化能力和學(xué)習(xí)能力,使其能夠像人類一樣處理各種復(fù)雜的場(chǎng)景和問(wèn)題。
  
  《企業(yè)家》:既然AI大模型對(duì)人形機(jī)器人如此重要,宇樹(shù)是如何布局的?
  
  陳立:目前,宇樹(shù)H1已經(jīng)開(kāi)始使用英偉達(dá)的人形機(jī)器人通用基礎(chǔ)模型,這些大模型提高了人形機(jī)器人在仿真環(huán)境中的學(xué)習(xí)效率,也讓我們的研發(fā)團(tuán)隊(duì)能夠更快地開(kāi)發(fā)出運(yùn)動(dòng)控制模型。
  
  2023年9月,宇樹(shù)人形機(jī)器人團(tuán)隊(duì)的幾位工程師第一次開(kāi)發(fā)人形機(jī)器人運(yùn)動(dòng)AI大模型時(shí),表現(xiàn)得相當(dāng)糟糕,機(jī)器人在運(yùn)動(dòng)時(shí)搖搖晃晃,甚至無(wú)法站立。有一天晚上,團(tuán)隊(duì)的一位工程師在電腦上對(duì)AI大模型進(jìn)行訓(xùn)練,忘記關(guān)機(jī)便回家了。第二天回來(lái)時(shí),發(fā)現(xiàn)訓(xùn)練出來(lái)的性能超出了預(yù)期。這正是當(dāng)前人工智能技術(shù)為人形機(jī)器人帶來(lái)的驚喜。
  
  盡管AI大模型很重要,但仍存在不足之處和挑戰(zhàn)。目前,語(yǔ)言大模型的應(yīng)用更為廣泛,但僅依靠語(yǔ)言大模型是不夠的。實(shí)際上,對(duì)于更智能的人形機(jī)器人來(lái)說(shuō),它還需要具備決策能力,以及如何協(xié)調(diào)雙手或雙腿來(lái)完成任務(wù),這也是未來(lái)需要克服的難點(diǎn)。
  
  AI大模型面臨成本和能源效率兩方面的挑戰(zhàn)。比如,OpenAI在開(kāi)發(fā)如GPT-4模型時(shí),資源消耗大。不僅大量依賴GPU板卡,同時(shí)又非常耗電。
  
  03
  
  落地還差什么?
  
  《企業(yè)家》:H1的落地應(yīng)用情況如何?宇樹(shù)又是如何了解客戶的真實(shí)需求的?
  
  陳立:我們已經(jīng)在高??蒲性核?、能源行業(yè)如國(guó)家電網(wǎng)、汽車(chē)工廠等場(chǎng)景落地。
  
  在具體的場(chǎng)景下有怎樣的需求,人形機(jī)器人能執(zhí)行哪些任務(wù),這需要雙方共同探索。比如,我們與國(guó)網(wǎng)成立了聯(lián)合攻關(guān)實(shí)驗(yàn)室,主要探索地下隧道和地下管廊等惡劣環(huán)境下,如何引入人形機(jī)器人進(jìn)行定期巡檢和維修。
  
  如果不建立這種合作,我們可能不了解這些需求和場(chǎng)景,也不清楚工人在這些環(huán)境中面臨的問(wèn)題,以及我們的人形機(jī)器人如何完成這些工作。合作的基礎(chǔ)是雙方互補(bǔ)。
  
  目前在具體需求方面,更多是需求方主動(dòng)找到我們。例如一些工廠的零部件裝配由工人完成,隨著勞動(dòng)力成本的上升,他們想改變,那么人形機(jī)器人就非常適合,因此會(huì)主動(dòng)找到我們,我們?cè)龠M(jìn)行評(píng)估。如果適合使用人形機(jī)器人,就會(huì)進(jìn)行現(xiàn)場(chǎng)測(cè)試,并與他們的團(tuán)隊(duì)共同合作。
  
  為了推動(dòng)人形機(jī)器人產(chǎn)業(yè)發(fā)展,我認(rèn)為強(qiáng)強(qiáng)聯(lián)合非常重要,而且這種合作方式是無(wú)邊界的,這樣不僅效率高,而且相互之間的配合程度也會(huì)非常好。
  
  《企業(yè)家》:為了加速人形機(jī)器人落地,您認(rèn)為還需要做些什么?
  
  陳立:我認(rèn)為目前應(yīng)著重考慮以下兩個(gè)方面的問(wèn)題。一方面,我們需要更深入地了解產(chǎn)品的應(yīng)用。比如,宇樹(shù)可能對(duì)某些行業(yè)的需求并不了解,但行業(yè)內(nèi)的專業(yè)人士卻非常了解。因此,我們需要與他們充分溝通,了解他們的需求和痛點(diǎn)。另一方面,我們需要考慮在實(shí)際場(chǎng)景中解決問(wèn)題的方法。有時(shí)候,人形機(jī)器人可能無(wú)法完成某些工作或者成本過(guò)高。這時(shí),我們可以通過(guò)工程化手段,在不改變機(jī)器人本身的情況下,調(diào)整場(chǎng)景或適配工程,以降低成本并提高適用性。
  
  《企業(yè)家》:隨著人形機(jī)器人的發(fā)展,會(huì)衍生出哪些新生態(tài)?如何參與這場(chǎng)浪潮?
  
  陳立:例如人形機(jī)器人進(jìn)入家庭充當(dāng)保姆的角色。對(duì)于家政公司來(lái)說(shuō),未來(lái)可能變成提供人形機(jī)器人租賃服務(wù)的公司。同樣,工廠中的工人也會(huì)改變。未來(lái)更多的人形機(jī)器人可能會(huì)進(jìn)入工廠,而勞務(wù)市場(chǎng)服務(wù)的對(duì)象可能就是人形機(jī)器人。人形機(jī)器人進(jìn)入工廠并不是取代工人的工作,而是讓工人從枯燥的工作中解放出來(lái),轉(zhuǎn)而從事更具技術(shù)含量的工作,推動(dòng)整個(gè)社會(huì)的進(jìn)步。
  
  從長(zhǎng)期來(lái)看,特別是在未來(lái)3~5年,對(duì)于提供服務(wù)類型的業(yè)務(wù),本地合作伙伴將發(fā)揮關(guān)鍵作用。我們可以輸出人形機(jī)器人本體,而本地的集成商、代理商或合作伙伴則負(fù)責(zé)提供本地化的服務(wù),實(shí)現(xiàn)共贏。
  
  《企業(yè)家》:對(duì)于正在創(chuàng)業(yè)的人,您有哪些經(jīng)驗(yàn)和建議?
  
  陳立:作為一名創(chuàng)業(yè)者,我在整個(gè)創(chuàng)業(yè)過(guò)程中面臨很多選擇和誘惑。作為企業(yè)的創(chuàng)始人/合伙人,我認(rèn)為重要的是堅(jiān)守自己的內(nèi)心,不被外界誘惑所左右。不能因?yàn)槟硞€(gè)領(lǐng)域很火就去跟風(fēng),而應(yīng)該堅(jiān)持自己的方向和未來(lái)規(guī)劃,避免精力分散。
  
  此外,如何帶領(lǐng)團(tuán)隊(duì)也非常重要。要讓團(tuán)隊(duì)成員清楚公司的核心價(jià)值觀、產(chǎn)品理念,共同為公司的發(fā)展而努力。