當資本重新聚焦人形機器人,具身智能迎來高度關注時,行業(yè)內(nèi)部卻呈現(xiàn)“兩極心態(tài)”。
星動紀元等企業(yè)訂單破5億、海外業(yè)務占比達50%,跑出高速增長曲線;而科研與產(chǎn)業(yè)界則反復強調(diào)泛化不足、落地成本高、數(shù)據(jù)匱乏等現(xiàn)實桎梏,甚至擔憂炒概念引發(fā)行業(yè)泡沫。
近日,10億元的A+輪融資,讓星動紀元及其背后的“模型—本體—場景數(shù)據(jù)”飛輪成為具身智能賽道的焦點。
同時,一個尖銳的問題隨之浮現(xiàn),具身智能距離“ChatGPT時刻”還有多遠?是等待單點爆發(fā)拐點,還是走向漫長分布式突破?在資本、場景與工程技術作用下,具身智能產(chǎn)業(yè)正站在復雜轉(zhuǎn)折點。
從“會執(zhí)行”到“會想象”,
星動紀元跑出加速度
近日,星動紀元完成近10億元A+輪融資,吉利資本領投,北汽產(chǎn)投跟投,北京市相關產(chǎn)業(yè)投資基金聯(lián)合注資。這輪融資不僅是資金增加,更明確了資本押注方向:“軟硬一體自研”“具身智能+產(chǎn)業(yè)協(xié)同”“模型工程化能力”。
自大模型進入商業(yè)化敏感周期后,資本愈發(fā)關注AI企業(yè)工程落地能力,模型參數(shù)與訓練數(shù)據(jù)量逐漸讓位于可復用場景與可規(guī)模交付的解決方案。
星動紀元堅持“具身大腦+人形本體”全棧自研路線,其具身大模型ERA - 42與人形本體平臺耦合,不僅能高精度控制全尺寸雙足人形機器人、五指靈巧手,還支撐多場景任務,在“端到端具身智能”全球競賽中,與Figure Helix、Tesla Grok和NVIDIA GR00T并列。
更關鍵的是,它構(gòu)建了物理世界 AI“模型-本體-場景數(shù)據(jù)”的正向循環(huán)飛輪,這被投資機構(gòu)視為更具確定性的壁壘。資本重新定價具身智能,正是基于這種“從算法到工程”的認知轉(zhuǎn)變。
而且,世界模型是近一年來具身智能技術鏈條中的關注焦點,其核心價值在于讓機器人在進入真實場景前,能在“想象空間”預演任務、評估策略、自我迭代。
比如,今年10月,清華陳建宇團隊與斯坦福Chelsea Finn團隊提出的可控生成世界模型Ctrl - World,使得機器人在陌生場景任務成功率提升44.7%,被視為具身智能“從可控到泛化”的關鍵突破。
而ERA - 42的迭代也與世界模型深度綁定,借助多模態(tài)感知與場景數(shù)據(jù)積累,實現(xiàn)穩(wěn)定視覺-語言-動作(VLA)聯(lián)動,完成多種任務。
過去機器人“會執(zhí)行”,如今世界模型讓它們開始“會想象”,這是具身智能跨越“專家系統(tǒng)式定制開發(fā)”走向“泛化智能”的分水嶺。不過,這種進化仍局限于特定場景,距通用具身智能還有一段距離。
具身智能的未來:
不是等待拐點,而是沿途開花
相比模型討論,星動紀元的商業(yè)化速度也頗受產(chǎn)業(yè)關注。2025年,公司總訂單額破5億元,物流行業(yè)最大單筆訂單近五千萬元,與吉利、雷諾等眾多企業(yè)深度合作,讓具身智能走出實驗室,進入產(chǎn)業(yè)真實工位。
更具指標意義的是海外業(yè)務,占比達50%。全球市值前十科技巨頭中九家是其客戶,海外覆蓋多地核心市場,還進入多所頂尖機構(gòu),成為其具身智能開發(fā)主要平臺之一。
這種布局打破國內(nèi)企業(yè)只能做低端落地場景的刻板印象,使其成為少數(shù)兼顧前沿研究與產(chǎn)業(yè)應用的中國機器人公司。
但商業(yè)化越快,挑戰(zhàn)越大,需驗證模型泛化能力、降低硬件成本、提升供應鏈穩(wěn)定性,產(chǎn)業(yè)化依然是一場壓力測試。
“人形機器人的ChatGPT時刻何時到來”這一拷問也隨之而來。
樂觀派認為具身智能商業(yè)化已經(jīng)走上軌道。雖然現(xiàn)階段泛化不足,但這是必然過程,從語言大模型發(fā)展路徑看,具身智能演進邏輯類似,隨著世界模型、VLA和控制策略迭代,機器人進入大量真實場景只是時間問題。
務實派則從產(chǎn)業(yè)視角指出,過去十年機器人滲透率低,是因為進入新場景的二次開發(fā)成本高昂。具身智能價值在于讓機器人具備場景遷移能力,即變得更便宜、更快、更普適。
也有人認為具身智能不會出現(xiàn)類似ChatGPT的單點爆發(fā),突破將呈分布式、漸進式,由大量“真實工位”推動,而非某個模型發(fā)布激活。
這是因為,當前主流VLA架構(gòu)受限于“信息流與控制流強耦合”,在非標場景難穩(wěn)定,且真實數(shù)據(jù)獲取有阻力,數(shù)據(jù)閉環(huán)不易。
因此,先做“場景通用”,從缺工、危險、高成本工位切入,以點帶面,再沉淀高價值數(shù)據(jù)與工藝know - how,這是更務實的產(chǎn)業(yè)路徑,即不等待拐點,而是提前沿途開花。
結(jié)語
具身智能能否迎來“ChatGPT時刻”?答案或許不是“會與不會”,而是什么樣的方式。
語言智能爆發(fā)源于純數(shù)字世界規(guī)則演化,具身智能臨界點則來自千百個真實工位的反復驗證與數(shù)據(jù)積累,它不是模型參數(shù)或發(fā)布會節(jié)點,而是長期累積的拐點。
具身智能的真正突破將以更慢、更深、更有韌性的方式發(fā)生,待到來時,人們或許會發(fā)現(xiàn)“ChatGPT時刻”早已在無數(shù)不起眼場景中悄然鋪開。