近兩年,隨著新一代人工智能出世,以及資本市場(chǎng)加強(qiáng)對(duì)未來(lái)產(chǎn)業(yè)的投入,人形機(jī)器人開(kāi)始逐漸從科幻走向現(xiàn)實(shí)。從資本市場(chǎng)近期表現(xiàn)看,人形機(jī)器人概念持續(xù)火熱,部分公司漲停連板?;ㄆ旆治鰩熤赋觯A(yù)計(jì)未來(lái)25年,人形機(jī)器人市場(chǎng)規(guī)模將達(dá)到驚人的7萬(wàn)億美元。
與此同時(shí),人形機(jī)器人部分產(chǎn)品也已開(kāi)始出售交付,大有批量“進(jìn)廠打工”趨勢(shì)。如2024年5月,特斯拉研發(fā)的二代Optimus人形機(jī)器人已進(jìn)廠實(shí)訓(xùn),計(jì)劃2025年年底前量產(chǎn)銷售。在國(guó)內(nèi),如宇樹(shù)科技、達(dá)闥科技等廠商均已在人形機(jī)器人領(lǐng)域有所布局。
除了工業(yè)領(lǐng)域,人形機(jī)器人離我們的生活還有多遙遠(yuǎn),何時(shí)能“飛入尋常百姓家”?當(dāng)前行業(yè)發(fā)展難點(diǎn)又有哪些?
近日,杭州宇樹(shù)科技有限公司創(chuàng)始人兼CEO王興興接受了《每日經(jīng)濟(jì)新聞》記者(以下簡(jiǎn)稱NBD)采訪。
5年內(nèi)將有終端產(chǎn)品
NBD:2023年,國(guó)內(nèi)很多人形機(jī)器人開(kāi)始“進(jìn)廠打工”,您怎么看這個(gè)現(xiàn)象?宇樹(shù)人形機(jī)器人的落地現(xiàn)狀和未來(lái)規(guī)劃是怎樣的?
王興興:我覺(jué)得這是一個(gè)趨勢(shì)。我們過(guò)去幾個(gè)月與蔚來(lái)的汽車工廠有合作,就現(xiàn)場(chǎng)部署了人形機(jī)器人做搬運(yùn)。這個(gè)領(lǐng)域目前基本處于試點(diǎn)階段,大家覺(jué)得這個(gè)方向有價(jià)值,就共同推進(jìn)落地部署,不過(guò)目前還沒(méi)有到真正的商業(yè)閉環(huán)階段。
我們公司主要是賣本體,如果是做科研教育、AI公司或者個(gè)人買來(lái)玩,我們完全歡迎。
此外,工業(yè)領(lǐng)域也在推進(jìn),比如我們希望去工廠幫忙做一些簡(jiǎn)單的生產(chǎn)裝配,或者一些簡(jiǎn)單的搬運(yùn)工作,蔚來(lái)汽車工廠就是典型例子。我們其實(shí)沒(méi)有給自己定目標(biāo)或者逼迫那么緊,還是尊重整個(gè)市場(chǎng)的反應(yīng),等技術(shù)、產(chǎn)品和大家接觸到一定程度,已經(jīng)展現(xiàn)出更好的商業(yè)勢(shì)頭了,我們?cè)俅笠?guī)模去推廣。
NBD:在人形機(jī)器人技術(shù)迅速發(fā)展的當(dāng)下,面臨的最大瓶頸是什么?目前人形機(jī)器人應(yīng)用領(lǐng)域中,哪些方面有可能實(shí)現(xiàn)突破性進(jìn)展?
王興興:當(dāng)下的最大瓶頸,包括人形機(jī)器人、四足機(jī)器人等,是基層AI在全球范圍內(nèi)都沒(méi)有達(dá)到一個(gè)像初代GPT或者初代通用AI的能力,這也是目前整個(gè)行業(yè)最大的問(wèn)題。
目前機(jī)器人本身,比如雙臂機(jī)器人或者工業(yè)機(jī)器人,如果加了AI以后產(chǎn)生的能效比人低,如速度比較慢、精度比較差、能干的活比較少,其實(shí)很難替代人在工業(yè)領(lǐng)域的價(jià)值,整個(gè)商業(yè)閉環(huán)沒(méi)法跑通。如果機(jī)器人AI的能力能突破一個(gè)臨界點(diǎn),使得工廠的基本工序能夠高效運(yùn)轉(zhuǎn),同時(shí)成本也相對(duì)較低,那么就可以實(shí)現(xiàn)商業(yè)閉環(huán)并大規(guī)模推廣,我認(rèn)為這將是非常有價(jià)值的。
當(dāng)然,目前硬件方面也存在一些挑戰(zhàn),例如機(jī)械臂的負(fù)載能力不足、精度不夠以及成本較高,但這些都屬于工程技術(shù)層面的問(wèn)題。所以,最大的問(wèn)題還是整個(gè)機(jī)器人AI沒(méi)有突破一個(gè)臨界點(diǎn),目前在具身智能或者機(jī)器人AI這個(gè)領(lǐng)域,當(dāng)下大家還覺(jué)得機(jī)器人有點(diǎn)笨拙,只能干一些固定的活,但我個(gè)人比較樂(lè)觀。再過(guò)三四年,不會(huì)超過(guò)五年,比如在工業(yè)或服務(wù)業(yè),能有終端產(chǎn)品出現(xiàn)。
機(jī)器人需要更高級(jí)功能
NBD:近期人形機(jī)器人火熱至極,但公司早期也不看好人形機(jī)器人,請(qǐng)問(wèn)宇樹(shù)是怎樣調(diào)整發(fā)展戰(zhàn)略的?
王興興:2020年以前就有很多投資人問(wèn)我,你們做不做人形機(jī)器人,我非常斬釘截鐵地說(shuō)不做,但為什么2023年初又開(kāi)始做人形機(jī)器人了?其實(shí)最早在2009年和2010年,我自己做過(guò)小的仿生人形機(jī)器人,當(dāng)時(shí)遠(yuǎn)沒(méi)有達(dá)到我的預(yù)期,最大原因是當(dāng)時(shí)全球人形機(jī)器人的控制技術(shù)不是特別理想,性能上不去,沒(méi)辦法看到實(shí)用價(jià)值,當(dāng)時(shí)我就堅(jiān)持不做人形機(jī)器人。
到了2021年、2022年,全球科技對(duì)人形機(jī)器人非常關(guān)注,并且在2022年底大語(yǔ)言模型出來(lái)以后,AI技術(shù)產(chǎn)生了質(zhì)變,已經(jīng)看到AI賦能機(jī)器人帶來(lái)的潛力。大家可能想象不到,2022年底,我們還沒(méi)做人形機(jī)器人,但已經(jīng)有一些客戶找上我們想買人形機(jī)器人。我覺(jué)得社會(huì)的共識(shí)、熱度,客戶對(duì)它的期待程度,已經(jīng)足夠了,所以我們2023年開(kāi)始正式做人形機(jī)器人。
我們一直希望公司的商業(yè)化進(jìn)程能夠保持積極正向,確保我們的產(chǎn)品受到市場(chǎng)的歡迎和社會(huì)的認(rèn)可。當(dāng)年選擇做四足機(jī)器人,是因?yàn)樾袠I(yè)已經(jīng)初現(xiàn)端倪,而現(xiàn)在選擇進(jìn)軍人形機(jī)器人領(lǐng)域也是基于相似的市場(chǎng)洞察。
NBD:從目前人形機(jī)器人的研發(fā)來(lái)看,大模型可重點(diǎn)解決哪些技術(shù)問(wèn)題?主要應(yīng)用在哪些方向?大模型和人工智能的應(yīng)用有望降低研發(fā)成本嗎?
王興興:目前大家說(shuō)大模型,一般在說(shuō)大語(yǔ)言模型或者多模態(tài)模型,實(shí)際上這部分是可以給機(jī)器人用的,2023年我們就結(jié)合了OpenAI的大語(yǔ)言模型接口,但實(shí)際上大語(yǔ)言模型本身是機(jī)器人模型的一部分,并不是全部。
比如跟機(jī)器人溝通的時(shí)候,肯定需要語(yǔ)言部分,但實(shí)際上我個(gè)人認(rèn)為機(jī)器人的AI模型,本質(zhì)上和語(yǔ)言模型還是有很大區(qū)別。舉個(gè)最直觀的例子,在工廠里工作的機(jī)器人,其實(shí)并不需要具備語(yǔ)音功能。只要它能夠完成任務(wù),進(jìn)行工作就足夠了。
機(jī)器人具身智能的核心在于其執(zhí)行任務(wù)的能力,而不僅僅是對(duì)話。手機(jī)已經(jīng)可以完成簡(jiǎn)單的對(duì)話任務(wù),因此機(jī)器人需要更高級(jí)的功能。然而,這部分的訓(xùn)練其實(shí)與大語(yǔ)言模型關(guān)系不大,更多地依賴于模仿學(xué)習(xí)。此外,該模型的結(jié)構(gòu)與大語(yǔ)言模型的結(jié)構(gòu)也存在較大差異。這是目前大家已經(jīng)看到的方向了,但是整個(gè)體系沒(méi)有大語(yǔ)言模型那么成熟。
在機(jī)器人具身智能領(lǐng)域,每家公司的想法都不太一樣,技術(shù)路線和共性都不太一樣,這就導(dǎo)致了其實(shí)很難評(píng)價(jià)發(fā)展路徑,是正確還是錯(cuò)誤。舉個(gè)最簡(jiǎn)單的例子,在大語(yǔ)言模型圈,ChatGPT模型出來(lái)以前,就有非常多語(yǔ)言模型結(jié)構(gòu),但大家現(xiàn)在已經(jīng)忘了,因?yàn)榘l(fā)現(xiàn)GPT模型的架構(gòu)更有價(jià)值?,F(xiàn)在人形機(jī)器人具生智能有點(diǎn)像ChatGPT出來(lái)的前一兩年,大家已經(jīng)發(fā)現(xiàn)了這個(gè)方向,要往這個(gè)方向做,但還沒(méi)有哪家敢說(shuō)自己的方向絕對(duì)正確。