作者:九林
3月18日的GTC上,英偉達(dá)創(chuàng)始人黃仁勛穿著他標(biāo)志性的黑色皮衣登場(chǎng),發(fā)布了全球最強(qiáng)AI芯片——Blackwell,將生成式AI推動(dòng)到了引爆點(diǎn)。
Blackwell 架構(gòu)的 GPU 擁有 2080 億個(gè)晶體管,采用定制的、雙 reticle 的臺(tái)積電 4NP(4N 工藝的改進(jìn)版本)制程工藝,兩塊小芯片之間的互聯(lián)速度高達(dá) 10TBps,可以大幅度提高處理能力。摩爾定律已死,可英偉達(dá)讓新的摩爾定律誕生了。
去年黃仁勛喊出 AI 的“iPhone 時(shí)刻”已經(jīng)到來?,F(xiàn)在,黃仁勛也被稱為“新的喬布斯”。在會(huì)上,黃仁勛還發(fā)布了多模態(tài)人形機(jī)器人模型及機(jī)器人芯片,并將其稱之為“英偉達(dá)的靈魂”。
?01、人形機(jī)器人的世界
不同于傳統(tǒng)工業(yè)機(jī)器人只為完成特定任務(wù)而存在,人形機(jī)器人自誕生便背負(fù)起了智能化期待——像人一樣感受世界、作出決策并執(zhí)行任務(wù)。1973年,日本早稻田大學(xué)推出了世界上第一臺(tái)全尺寸仿人機(jī)器人WABOT-1,它能夠用日語與人交流,測(cè)量方向與距離,緩慢行走并抓取物體,相當(dāng)于一歲半兒童的智力。
然而,半個(gè)世紀(jì)過去,人形機(jī)器人似乎還遙遙無期。更遑論商業(yè)化中還有性能、成本的核心阻力。
前段時(shí)間,一夜之間全網(wǎng)被一段人形機(jī)器人的視頻刷屏了。視頻里,這款機(jī)器人按照人類口頭指令進(jìn)行了一些簡單的抓取和放置動(dòng)作,比如遞給人類蘋果、將塑料袋收拾進(jìn)籃子里,把杯子和盤子歸置放在瀝水架上。整個(gè)交互過程里,機(jī)器人與人類對(duì)答如流,雖然在反應(yīng)速度上與真人還有一定差距,但顯然已經(jīng)大大提高。
與此同時(shí),機(jī)器人還能夠理解人類的意圖,在執(zhí)行指令的同時(shí)還能介紹這么做的原因。這個(gè)機(jī)器人名為Figure 01,他正是由一家名為Figure的人工智能機(jī)器人公司推出的。而這一切背后,不僅有Figure引以為傲的“端到端”神經(jīng)網(wǎng)絡(luò)技術(shù),還有OpenAI強(qiáng)大的大模型作支撐。
現(xiàn)在,F(xiàn)igure將第一款人形機(jī)器人Figure 01送入寶馬的斯巴坦堡汽車工廠,代替人類從事危險(xiǎn)度高的作業(yè)。目前,不僅僅是Figure在制造人形機(jī)器人。實(shí)際上,眾多科技公司都已經(jīng)開始展露自家的人形機(jī)器人。
亞馬遜在其倉庫運(yùn)營中測(cè)試一款人形雙足機(jī)器人Digit,Digit由亞馬遜投資的Agility Robotics設(shè)計(jì)。
特斯拉發(fā)布的人形機(jī)器人 Tesla Optimus Gen 2。第二代人形機(jī)器人看起來比上一代具有更大的靈活性——包括更優(yōu)雅的行走姿勢(shì)以及自由度更大的雙手,甚至可以用它來完成煮雞蛋等精細(xì)活。這距離特斯拉推出第一代人形機(jī)器人,才經(jīng)過短短三年的時(shí)間。
3月,三星電子制定進(jìn)軍機(jī)器人市場(chǎng)的戰(zhàn)略。給本土機(jī)器人廠商Rainbow Robotics投資了超過3億人民幣,這家公司旗下的機(jī)器人HUBO,是韓國第一臺(tái)兩足步行機(jī)器人。由此帶來的人形機(jī)器人融資也開始火熱。
國外方面,人形機(jī)器人公司Figure A已經(jīng)獲得6.75億美元融資。參與融資的除了OpenAI以外,金主還有微軟、英偉達(dá)、亞馬遜創(chuàng)始人杰夫·貝索斯、英特爾、風(fēng)投公司Parkway Venture Capital 、Align Ventures 、“木頭姐”旗下的方舟基金等等。除了備受科技大佬青睞的Figure AI以外,受到OpenAI支持的挪威機(jī)器人初創(chuàng)公司1X Technologies宣布完成1億美元B輪融資,本輪融資由瑞典風(fēng)投公司EQT Ventures領(lǐng)投,其他投資方還包括三星電子旗下投資公司三星NEXT,以及Nistad集團(tuán)、Sandwater和Skagerak Capital等挪威風(fēng)投公司。
國內(nèi)方面,2023年國內(nèi)共有9家人形機(jī)器人企業(yè)獲得累計(jì)超過19億的融資,其中有3家企業(yè)單輪融資金額超億元,人形機(jī)器人創(chuàng)企智元機(jī)器人更是在接近半年的時(shí)間里連續(xù)獲得五輪融資。智能機(jī)器人公司宇樹科技Unitree于近日宣布完成近10億元B2輪融資,本輪投資方包括美團(tuán)、金石投資、源碼資本,老股東深創(chuàng)投、中網(wǎng)投、容億、敦鴻和米達(dá)鈞石跟投。據(jù)宇樹科技介紹,公司目前有四足機(jī)器人和通用人形機(jī)器人兩大系列產(chǎn)品,通用人形機(jī)器人是公司2023年開啟的新業(yè)務(wù)方向。
?02、英偉達(dá)布局人形機(jī)器人
英偉達(dá)的人形機(jī)器人項(xiàng)目,代號(hào)是GROOT。這個(gè)名字的由來,應(yīng)該是致敬了漫威宇宙的超級(jí)英雄Groot。
英偉達(dá)的這個(gè)新平臺(tái)被稱為“通用人形機(jī)器人基礎(chǔ)模型”。實(shí)際上,英偉達(dá)是在為最近涌現(xiàn)的人形機(jī)器人制造商提供一個(gè)AI平臺(tái)。其中包括 1X Technologies、Agility Robotics、Apptronik、波士頓動(dòng)力、Figure AI、Fourier Intelligence、Sanctuary AI、宇樹科技和小鵬鵬行等公司。這幾乎涵蓋了目前所有知名的人形機(jī)器人制造商,除了特斯拉等少數(shù)例外。
由GR00T驅(qū)動(dòng)的機(jī)器人有兩個(gè)很大的特點(diǎn):能夠理解自然語言、觀察人類行為并模仿動(dòng)作。這兩大特點(diǎn),能夠使得機(jī)器人能夠快速學(xué)習(xí)協(xié)調(diào)性、靈活性和其他技能,以導(dǎo)航、適應(yīng)和與現(xiàn)實(shí)世界互動(dòng)。
黃仁勛還表示:“由該平臺(tái)提供支持的機(jī)器人,絕不會(huì)導(dǎo)致機(jī)器人起義?!痹诂F(xiàn)場(chǎng)的大會(huì)中,視頻展示了數(shù)臺(tái)機(jī)器人是如何完成各種各樣的任務(wù)。有的機(jī)器人可以模仿人類打架子鼓、有的可以從視頻中學(xué)習(xí)人類的舞蹈動(dòng)作并進(jìn)行模擬。
基于大語言模型,有的人形機(jī)器人還可以理解人類的口頭指令,并作出回應(yīng)。此外,英偉達(dá)還發(fā)布一款基于NVIDIA Thor系統(tǒng)級(jí)芯片(SoC)的新型人形機(jī)器人計(jì)算機(jī)Jetson Thor。
這個(gè)SOC中包括一個(gè)帶有transformer engine的下一代GPU,其采用NVIDIA Blackwell架構(gòu),可提供每秒800萬億次8位浮點(diǎn)運(yùn)算AI性能,以運(yùn)行GR00T等多模態(tài)生成式AI模型。目前迪士尼的兩款Orange和Green的小型機(jī)器人,使用的就是英偉達(dá)為機(jī)器人設(shè)計(jì)的首款A(yù)I芯片Jetson。
黃仁勛說:“下一代機(jī)器人很有可能是人形機(jī)器人,因?yàn)槲覀冇懈嗟哪7掠?xùn)練數(shù)據(jù)可以提供給和我們構(gòu)造相似的機(jī)器人們。人形機(jī)器人可以更有效率地部署在人類設(shè)計(jì)的工作站、制造和物流環(huán)節(jié)中?!?/p>
?03、人形機(jī)器人背后的千億美元級(jí)市場(chǎng)
有報(bào)告中直言,人形機(jī)器人有望成為千億美元級(jí)藍(lán)海市場(chǎng),預(yù)計(jì)在中性假設(shè)下,2035年全球人形機(jī)器人制造和家庭服務(wù)市場(chǎng)規(guī)模為1103億美元。
而人形機(jī)器人能夠涉及的產(chǎn)業(yè)鏈更加龐大。總體來看,上游的核心軟硬件系統(tǒng)至關(guān)重要,硬件主要包括伺服電機(jī)、減速器、控制器、傳感器、大算力芯片等;軟件包括機(jī)器視覺、人機(jī)交互、機(jī)器學(xué)習(xí)、系統(tǒng)控制等。機(jī)器人由運(yùn)動(dòng)模塊、傳感模塊和人工智能模塊三個(gè)關(guān)鍵技術(shù)模塊組成。
對(duì)于一般的傳統(tǒng)機(jī)器人來說,只需要其中一種技術(shù)往往就能具備使用價(jià)值。比如,工業(yè)機(jī)器人主要側(cè)重于運(yùn)動(dòng)控制技術(shù),掃地機(jī)器人則側(cè)重于導(dǎo)航傳感技術(shù)。
傳感器
比如前文提到的特斯拉第二代Optimus,如果我們仔細(xì)分析其零部件,會(huì)發(fā)現(xiàn):特斯拉設(shè)計(jì)的執(zhí)行器與傳感器、2自由度驅(qū)動(dòng)頸部、響應(yīng)更快的11自由度靈巧手、觸覺傳感器(十指)、執(zhí)行器集成電子和線束、足部力/扭矩傳感器、鉸接式腳趾等。而第二代Optimus產(chǎn)品,最大的邊際增量在于傳感器。在特斯拉展示Optimus時(shí),Gen2展現(xiàn)了更好的全身控制和身體平衡能力(深蹲),以及更精準(zhǔn)的手部操作(操作雞蛋)。
人形機(jī)器人需要用到多種傳感器,包括力矩傳感器,拉壓力傳感器、編碼器、溫度傳感器、六維力傳感器和慣導(dǎo)傳感器等。其中,慣導(dǎo)傳感器(IMU)是實(shí)現(xiàn)人形機(jī)器人姿態(tài)控制的核心,六維力傳感器是力控、擺動(dòng)穩(wěn)定控制的核心,可精準(zhǔn)測(cè)量隨機(jī)變化的力。目前在傳感器方面的相關(guān)企業(yè)包括,漢威科技、蘇州能斯達(dá)、弘信電子子公司瑞滸科技、柯力傳感、東華測(cè)試等。
大算力芯片
人形機(jī)器人作為高度集成的機(jī)器人,跟工業(yè)機(jī)器人有所區(qū)別,所需要的芯片算力要求較高。比如,小米最新發(fā)布的仿生四足機(jī)器人CyberDog 2為例,配置了21T的算力;智元機(jī)器人剛剛發(fā)布的遠(yuǎn)征A1人形機(jī)器人也配置了高達(dá)200T的AI算力。這方面還是主要看頭部廠商,包括英偉達(dá)、英特爾Mobileye、高通等。
?04、結(jié)語
Open AI CEO 薩姆·奧爾特曼在X上發(fā)的一條推文:“這是人類歷史上最有趣的一年,但將是未來最無聊的一年?!边@條推文可能是時(shí)代的一個(gè)腳注。
目前,根據(jù)《上海市進(jìn)一步推進(jìn)新型基礎(chǔ)設(shè)施建設(shè)行動(dòng)方案(2023-2026年)》總體部署,2024年上海將聚焦新網(wǎng)絡(luò)、新算力、新數(shù)據(jù)、新設(shè)施、新終端五方面,重點(diǎn)推進(jìn)56項(xiàng)任務(wù)。
上海將爭取人形機(jī)器人國家制造業(yè)創(chuàng)新中心落地?,F(xiàn)在,在安徽合肥蔚來汽車工廠,新報(bào)到的優(yōu)必選工業(yè)版人形機(jī)器人Walker S在檢查完車鎖、安全帶和車燈蓋板后,徑直地走向車前,為新車貼上車標(biāo)。曾經(jīng)寫在小學(xué)作文中的場(chǎng)景已經(jīng)在真正上演。
許在未來十年后,我們真的能夠?qū)崿F(xiàn)機(jī)器人和人類可以和諧相處、共同工作。