“技術(shù)并不是唯一的產(chǎn)品的驅(qū)動(dòng)項(xiàng)目,需求才是。所以我們對人形機(jī)器人的理解可以總結(jié)成八個(gè)字:響應(yīng)場景,響應(yīng)客戶。”在接受界面新聞采訪時(shí),頭部人形機(jī)器人企業(yè)傅利葉這樣形容自己現(xiàn)階段的目標(biāo)。
成立于2015年的傅利葉做醫(yī)療康復(fù)機(jī)器人起家,也是最早成功量產(chǎn)通用人形機(jī)器人的企業(yè)之一。2023年,傅利葉發(fā)布了首款通用人形機(jī)器人GR-1,迄今已交付超過100臺。
這不是一個(gè)小數(shù)目。一個(gè)參考是,全行業(yè)人形機(jī)器人也僅量產(chǎn)交付不超過1000臺。據(jù)晚點(diǎn)LatePost報(bào)道,特斯拉旗下的人形機(jī)器人Optimus目前產(chǎn)量在數(shù)百臺級別。
人形機(jī)器人量產(chǎn)的確存在挑戰(zhàn)。馬斯克曾承諾2024年內(nèi)會讓Optimus在特斯拉工廠中工作,2025年之前即可向其他公司交付。但在今年7月,他更改了口徑,2025年才會有少量的人形機(jī)器人進(jìn)廠,大批量交付則要等到2026年。
量產(chǎn)交付的困難在于,對于人形機(jī)器人這樣既新又復(fù)雜的物種,全球還沒有一條成熟的供應(yīng)鏈。許多人形機(jī)器人行業(yè)人士都向界面新聞表達(dá)過類似的觀點(diǎn),制造人形機(jī)器人是從0到1的過程,想要量產(chǎn)交付很大概率需要自建產(chǎn)線,大量的零部件需要與供應(yīng)鏈共同打磨,因?yàn)槭忻嫔险也坏饺魏螛?biāo)準(zhǔn)件。
圖片來源:傅利葉
這也讓人形機(jī)器人走入了某種困境:難以量產(chǎn),也就難以進(jìn)入真實(shí)場景中進(jìn)行訓(xùn)練,而如果缺乏真實(shí)場景的訓(xùn)練數(shù)據(jù),也就難以讓人形機(jī)器人的認(rèn)知能力獲得突破式的提升,難以適應(yīng)真實(shí)世界的任務(wù)。換言之,它可能很難落地應(yīng)用,也就無法收獲訂單。
為什么真實(shí)場景如此重要?它是人形機(jī)器人實(shí)現(xiàn)iPhone時(shí)刻的前提。顧捷認(rèn)為,人形機(jī)器人在真正突破iPhone時(shí)刻之前,還有三個(gè)方面要不斷迭代:優(yōu)越的具身智能本體,更具靈活性和運(yùn)動(dòng)性能;物理世界中的真實(shí)數(shù)據(jù);有了數(shù)據(jù),才能進(jìn)行高算力的大規(guī)模訓(xùn)練,從而逐步實(shí)現(xiàn)泛化的能力。
但由于量產(chǎn)交付量較少,現(xiàn)有用于人形機(jī)器人訓(xùn)練的數(shù)據(jù),有接近80%都來自于仿真環(huán)境。仿真環(huán)境收集數(shù)據(jù)固然是一種省力的辦法,但由于人形機(jī)器人的重點(diǎn)在于「人」而非「機(jī)器」,它最終的目的是代替人去執(zhí)行人類工作,如果要讓操作準(zhǔn)確度達(dá)到 100%,還是需要真實(shí)場景的訓(xùn)練。
正因如此,小批量量產(chǎn)交付成為現(xiàn)階段許多人形機(jī)器人公司最重要的課題。顧捷認(rèn)為,量產(chǎn)交付100臺,讓一款人形機(jī)器人從實(shí)驗(yàn)室走到客戶端,是它成為一款商品的必經(jīng)過程。這也是為什么,盡管人形機(jī)器人還無法在工廠中擔(dān)任任何職務(wù),但許多廠商都迫切地希望它能夠快速進(jìn)廠實(shí)訓(xùn)。
由于交付進(jìn)度較快,傅利葉GR-1也是少有的、在真實(shí)場景中得到訓(xùn)練的人形機(jī)器人之一。此前發(fā)布的傅利葉GR-1共有四類客戶群體和應(yīng)用場景,除了最廣泛的科研場景之外,也在工廠參加實(shí)訓(xùn)、還用于迎賓接待以及替代人類不宜操作的高危場景。
在收取客戶反饋和不停迭代之后,傅利葉在近日發(fā)布了身高175cm、體重63kg、全身共有53個(gè)自由度,單臂運(yùn)動(dòng)負(fù)載達(dá)3kg的通用人形機(jī)器人GR-2。它擁有更開放的開發(fā)框架,能夠支持機(jī)器人研究學(xué)者、工業(yè)自動(dòng)化工程師和AI軟件開發(fā)者定制更豐富的應(yīng)用程序,完善其功能。
這當(dāng)然還沒有接近人形機(jī)器人最理想的形態(tài),但這是所有人形機(jī)器人公司現(xiàn)階段的主要任務(wù):收集真實(shí)的場景反饋,讓機(jī)器人擁有更接近于人、更適應(yīng)真實(shí)世界的反應(yīng)能力與操作水平。
“通用人形機(jī)器人的GPT時(shí)刻還很難說,它還沒有達(dá)到大模型那樣的成熟期,但是我們已經(jīng)看到了曙光。它不是10年到20年的事情,而是3年到5年的事情。”顧捷預(yù)計(jì),明年人形機(jī)器人行業(yè)量產(chǎn)交付的規(guī)模將會達(dá)到1000臺,那將是下一個(gè)值得行業(yè)期待的時(shí)刻。