訂閱
糾錯
加入自媒體

具身智能創(chuàng)業(yè)者圖鑒:科學家們,從象牙塔走向修羅場

2025-08-26 11:26
星河頻率
關注

編者按:

在具身智能創(chuàng)業(yè)浪潮中,創(chuàng)始人們的背景與路徑,決定了企業(yè)的技術走向與商業(yè)氣質。

真格基金曾把創(chuàng)業(yè)者分為四類:小天才、老司機、科學家、操盤手。

這一分類啟發(fā)我們,試圖以此為框架,梳理具身智能領域的創(chuàng)業(yè)人群,開啟具身智能公司群像專題。

科學家是高校教授、研究員與長期從事技術研發(fā)的人,代表著最前沿的學術力量。

老司機是連續(xù)創(chuàng)業(yè)者,過往經歷讓他們在起伏中更懂得如何把握節(jié)奏;

操盤手是來自大廠的高管,把成熟的方法論和資源帶入新戰(zhàn)場;

小天才則是年輕的 95 后創(chuàng)業(yè)者,以銳氣和獨特視角,激發(fā)出不同尋常的可能性。

在不同出身、不同路徑的交匯中,我們或許能更清晰地理解具身智能的創(chuàng)業(yè)版圖,以及它正在被塑造的未來。

當然,具身智能賽道上遠不止這四類創(chuàng)業(yè)者,還有更多派別正在形成,這個系列,也將持續(xù)記錄他們共同勾勒的具身智能全景。

作者 | 向欣

在創(chuàng)業(yè)早期,創(chuàng)始團隊的光環(huán)往往是投資人最看重的因素。

放在具身智能行業(yè),這種光環(huán)最盛的,正是從高校與科研機構走出來,長期從事技術研發(fā)的科學家們。

據 IT 桔子統計,2025 年上半年機器人公司融資榜單前五名分別是銀河通用、新石器無人車、元鼎智能(泳池機器人)、自變量機器人、宇樹科技。

剔除與具身智能概念關聯較弱的新石器、元鼎智能后,一個耐人尋味的現象是:銀河通用、自變量機器人這兩家「科學家氣質」?jié)夂竦钠髽I(yè),融資規(guī)模甚至超過了老牌機器人公司宇樹科技。

這一定程度上說明了科學家類企業(yè)在資本市場上的耀眼光芒。

在我們統計的具身智能賽道 32 家核心公司中,有 16 家由科學家創(chuàng)立或主導。他們出身清華、北大、上海交大、浙大、哈工大,或是海外的伯克利、斯坦福等名校。

這群人曾經的舞臺在實驗室與學術會議上,成果是論文、代碼與原型機。但如今,他們走向產業(yè)前線,把機器人從象牙塔拉出來,推向工廠、家庭與社會。

科學家類代表著最前沿的學術力量,也承擔著最艱難的任務:科研向商業(yè)的轉化。前者是他們的優(yōu)勢所在,后者是他們創(chuàng)業(yè)路上最大的不確定性。

他們發(fā)展出不同的技術路徑,既有共識,也有分歧。

清華系人才成主力

我們梳理了 16 家由具身智能科學家類創(chuàng)業(yè)公司的團隊背景,統計出 32 位核心創(chuàng)業(yè)者。他們的學術背景主要集中在五所國內外頂尖高校與科研機構:清華大學、浙江大學、中國科學院、哈爾濱工業(yè)大學、斯坦福大學。

究其原因并不復雜。上世紀 90 年代,中國就已啟動智能機器人相關研究,而清華、浙大、中科院、哈工大是最早一批設立機器人項目、實驗室或研究所的機構,研究方向涵蓋機械設計、機器人控制、智能感知等關鍵領域。

清華大學 1985 年成立了國內首個智能機器人實驗室。2004 年,清華機器人足球隊成立,后來發(fā)展為在 RoboCup 屢獲佳績的「清華火神隊」。加速進化聯合創(chuàng)始人、首席科學家趙明國正是「清華火神隊」的創(chuàng)始人,并長期帶隊參賽。

浙江大學 2006 年開始人形機器人研究,推出了「悟空」系列,攻克了動態(tài)平衡、全身協調控制等關鍵難題!肝蚩 I」甚至能與人類或機器人進行上百回合的乒乓球比賽。

中國科學院下屬的沈陽自動化研究所被譽為「中國機器人事業(yè)的搖籃」,1989 年,依托于沈陽自動化研究所的中國科學院機器人學開放研究實驗室正式成立,后該實驗室在 2007 年獲批為機器人學國家重點實驗室。

斯坦福大學則更早,在上世紀 60 年代便成立人工智能實驗室,探索機器人與 AI 的結合。

技術積累還可以從專利窺見一斑。新戰(zhàn)略產業(yè)研究所數據顯示,清華、哈工大、浙大在人形機器人相關專利申請上分別排第一、三、四名;另有 IncoPat 全球專利數據庫的數據顯示,在人工智能領域,浙大、清華的專利申請量分列全國第一和第二。而從公司創(chuàng)業(yè)團隊目前或曾經的任職機構來看,清華大學、南方科技大學成為孵化科學家類企業(yè)的主要基地。

從這些統計中,可以明顯看出:清華系人才是科學家類企業(yè)的中堅力量。

目前,至少有四家科學家類企業(yè)直接源自清華:加速進化、星動紀元、星海圖、千訣科技。逐際動力首席科學家潘佳、大寰機器人創(chuàng)始人孫杰、銀河通用創(chuàng)始人王鶴等,也都是清華校友。

除了清華這所高校本身在機器人領域積淀已久,培育出大量人才的因素外,清華系投資機構對于培育本校企業(yè)也起到了至關重要的作用。比如,水木清華校友基金便多次投資加速進化等清華背景團隊。

對于科學家類企業(yè)來說,他們能夠依托高?蒲匈Y源和基金,直接接觸國際最前沿的技術,為科研成果轉化提供直接助力。

在人才方面,多數科學家類企業(yè)也有獨特的優(yōu)勢,博士生、碩博后、實驗室助研往往成為創(chuàng)業(yè)公司最初的員工,形成天然的團隊延展。

更深層次的,是學術網絡的傳導。導師推薦、聯合實驗室、國際學術圈交流——這些關系構成了科學家類創(chuàng)業(yè)背后的看不見的脈絡。 

在融資層面,這種網絡也很關鍵。投資人往往相信「清華系」「斯坦福系」的創(chuàng)業(yè)者,因為這些名字本身意味著研究深度和技術積累。

技術理想主義驅動的產品布局

雖然都強調技術驅動,但科學家派企業(yè)在產品和路線選擇上,分化為三大類:

本體/小腦派:專注于機器人本體與運動、感知能力,代表企業(yè)有月泉仿生、加速進化、帕西尼感知。

全棧派:覆蓋「本體+小腦+大腦」,試圖掌握完整生態(tài)。代表企業(yè)有星動紀元、星海圖、逐際動力。

大模型/零部件派:不做整機,而是專注具身大模型或關鍵零部件,如千訣科技、戴盟機器人、大寰機器人。

可以看到,大多數科學家派企業(yè)傾向于走全棧路線。這不僅是因為機器人系統軟硬件耦合度高,更反映出學院派的技術偏好:他們更愿意從系統層面出發(fā),構建完整鏈條來實現技術落地。

這種「終局導向」還體現在選擇開發(fā)全尺寸人形機器人。除了加速進化主要研發(fā) 1.2 米的小尺寸機型,其他多數企業(yè)研發(fā)的都是 1.6 米以上、接近成人體型的全尺寸機器人。

這種選擇的背后,是他們希望機器人能真正適應人類環(huán)境、具備強負載和復雜操作能力,從而在更廣闊場景中實現通用性。

另一個值得注意的現象是:在全棧派企業(yè)中,更側重研發(fā)大模型的團隊多數選擇輪式人形機器人,如銀河通用、自變量機器人、跨維智能、星海圖。

相比雙足,輪式降低了研發(fā)門檻和人力投入,使有限的團隊資源更集中于大模型研發(fā)。

總體來看,科學家派在硬件與全棧方面各有探索,但真正拉開差距的,是在大模型上的突破。

重點研發(fā)具身大模型,且最受業(yè)界關注的有四家企業(yè):星動紀元、銀河通用、自變量機器人、星海圖。

這四家企業(yè)的共性是,不約而同地做了端到端 VLA 模型。技術思路與 Figure、PI (Physical Intelligence)、NVIDIA 等國際前沿研究同步。

他們普遍認為,只有端到端大模型才能實現任務泛化,避免傳統分層架構的割裂。這一思路也與自動駕駛領域正在驗證的技術范式一致。

無論是專注本體的小而美,還是覆蓋全棧的體系化,抑或切入大模型與零部件的聚焦型探索,科學家派企業(yè)都在用各自的學術積累尋找產業(yè)落點。

盡管路徑不同,但幾乎所有團隊都在走向同一個共識——具身大模型是未來的「核心戰(zhàn)場」。因此,科學家派的差異,最終可能集中體現為對大模型的理解與實踐。

具身大模型的路線差異

具身大模型的本質競爭力在于模型算法和數據體系。

從模型算法上看,星動紀元、銀河通用、自變量機器人、星海圖四家企業(yè)中,只有自變量機器人強調其模型實現了大小腦統一,而其他企業(yè)都使用了類似雙系統的架構,將高層次的理解規(guī)劃、低層次的運動控制分為一個系統中的不同模塊,與 Figure AI 的 Helix 模型,PI 的π0 模型類似。

星動紀元有兩個特點:

一是在大模型中,融入了世界模型,增強機器人對物理世界的理解;

二是借鑒 Sora 思路,利用 AIGC 生成式技術,通過生成視頻,幫助機器人預測未來場景,讓機器人「看著答案」行動,大大增強泛化能力。

目前的 ERA-42 是集視覺、理解、預測、行動為一體的模型,可實現同一個端到端 VLA 模型控制高自由度人形機器人的全身靈巧操作,語音命令即可完成上百種復雜操作,包括柔性物品分揀、掃碼,使用螺釘槍、移液器等。

銀河通用的模型 GraspVLA 架構則與 PI 的π0 模型基本一致,同樣由 VLM 和一個基于流匹配的動作專家模型組成。

GraspVLA 的最大特點是泛化性極強,是全球首個僅需預訓練就能實現零樣本(Zero-Shot)泛化的模型,可適應高度、平面位置、物體類別、光照、干擾物、背景等環(huán)境條件的變化,且具備自主決策能力與強抗干擾能力。

基于 GraspVLA,銀河通用還推出了面向零售商業(yè)化場景的端到端大模型 GroceryVLA,在商品種類繁雜、密集堆疊的貨架場景中,無需針對每種商品單獨調參,抓取全品類商品,并且零場景預采集要求,部署極其便捷。

自變量機器人的端到端通用具身大模型 WALL-A 同樣具備泛化性、通用性強的特點,在不久前的 WRC 上展示了制作香囊、家務整理、分揀快遞、工業(yè)組裝(僅用不到兩天時間學會組裝皮帶)的任務,對柔軟物品、不斷變化的環(huán)境、不同外觀的物品都具有強大的適應性。

不過,相比其他公司的模型,自變量的模型對機器人所接受到的各種信息整合程度更深,實現了端到端的信息融合。

自變量機器人整合信息的具體方式為:將所有輸入模態(tài),包括多視角圖像、文本指令與機器人實時狀態(tài),通過各自的編碼器轉化為統一的 token 序列,使機器人在視覺、語言和動作等多種信息通道間實現高效對齊,顯著提升了模型在超長序列任務中的上下文推理與自我反饋能力。

在數據體系方面,四家企業(yè)雖然都會將視頻、語言、動作、遙操作等多模態(tài)數據混合使用,但側重點有所不同,從而形成了兩種不同的數據策略。

一種是規(guī)模優(yōu)先型,強調低成本、大規(guī)模數據積累,以量取勝,目標是支撐具身大模型的端到端訓練,達到「大力出奇跡」的效果。星動紀元、銀河通用屬于這一類。

星動紀元使用視頻數據對模型進行預訓練,視頻數據中包括大量互聯網人類視頻與 AI 生成視頻,易于獲得。

而銀河通用堅持仿真合成數據路線,研發(fā)出一套針對端到端 VLA 模型預訓練的全仿真合成數據生產管線,在短短一周內就能生成全球規(guī)模最大的十億級機器人操作數據集(包含視頻-語言-動作三個模態(tài))。

另一種是質量優(yōu)先型。聚焦高質量真機數據,強調對模型泛化能力和學習效率的提升。星海圖、自變量機器人選擇了這一路線。

星海圖構建了全球首個開放場景高質量真機數據集 Galaxea Open-World Dataset,覆蓋住宅、廚房、零售和辦公室等 50 種環(huán)境,總計包含 500 小時高質量移動操作數據,涵蓋超過 150 種任務、1600 多種操作對象以及 58 種操作技能。

自變量機器人創(chuàng)始人王潛介紹,公司自研了一系列數據采集設備,有幾十個模型支撐自變量機器人的數據系統。

王潛認為,在 Scaling Law 中,數據質量才是最核心的要素,其次是多樣性,最后才是數量。他在大模型訓練實踐中發(fā)現,高質量數據往往幾百幾千條就能帶來顯著提升,而低質量數據即便上億條,也可能讓模型越學越差。

數據選擇策略的不同,本質上是對具身智能發(fā)展瓶頸的不同判斷。前者希望解決的是數據稀缺問題,后者希望解決的是數據有效性問題。

這也代表了科學家派企業(yè)在具身智能大模型上兩種不同的認知:是依賴規(guī)模催生智能,還是通過高質數據夯實通向落地的基礎。

技術優(yōu)勢和商業(yè)劣勢,一同被放大

科學家作為具身智能賽道中最具技術含金量的力量,優(yōu)勢鮮明,短板也同樣鮮明。

優(yōu)勢在于技術前瞻性,他們往往能比市場更早看到未來的技術發(fā)展方向。

例如,星動紀元在 2024 年就將清華姚班團隊提出的 HiRT 框架(星動紀元創(chuàng)始人陳建宇亦為 HiRT 論文作者之一)的快慢系統架構應用到自研的端到端原生機器人大模型 ERA-42 中;而 2025 年美國明星人形機器人企業(yè) Figure AI 發(fā)布的 Helix 模型,恰好采用了與 HiRT 高度相似的架構。

自變量機器人也提前預判到了技術的走向。

王潛介紹,他們在 2024 年 10~11 月就著手研發(fā) any-to-any 模型,實現多模態(tài)輸入輸出,還同期完成具身思維鏈(COT)研發(fā)。這與 Google Gemini robotics 2025 年 3 月公布的進展、以及近期 Physical Intelligence(PI)公布的π0.5 模型技術方向高度一致,與國際頂尖水平同步。

劣勢在于對商業(yè)化的敏感性可能不足?茖W家創(chuàng)始人習慣學術邏輯,追求完美解法,而市場的要求往往是夠用就好。

如何平衡技術理想與場景要求,是一個難題。

目前科學家類具身智能企業(yè)的商業(yè)化路徑主要有三種。

一是覆蓋多種場景,包括家庭、工業(yè)、商業(yè)服務等,并參與場景開發(fā)的企業(yè),包括星動紀元、樂聚機器人、自變量機器人等。這也是多數科學家類企業(yè)選擇的打法。

這種策略在展示人形機器人通用性時頗具吸引力,也符合行業(yè)對機器人應用終局的期待,但一旦落到商業(yè)化層面,可能難以找到核心落腳點來實現閉環(huán),容易陷入「樣樣通,樣樣松」的困境。

二是已經有初步聚焦的場景或技能方向。

如加速進化,專注機器人運動性能的提升,主要面向科研場景銷售;銀河通用主要聚焦「移動-抓取-放置」的閉環(huán)操作,應對零售與工業(yè)場景中的大量「抓—放—移動」式作業(yè)。

三是不直接做場景開發(fā),提供具身智能基礎設施的企業(yè),比如星海圖、逐際動力。他們主要面向各類開發(fā)者提供基礎的通用軟硬件(包含具身通用大模型+機器人本體),讓個人開發(fā)者或場景方成為開發(fā)應用的人。

目前具身智能的應用仍處在探索階段,商業(yè)路徑尚無定論,也難言優(yōu)劣。但具身智能的應用落地對一家企業(yè)的真正考驗,已不僅是技術本身,而是能否在組織搭建、資金運用和戰(zhàn)略落點上展現持續(xù)能力。

技術突破只是起點,如何把突破轉化為可規(guī);漠a品與市場,才是決定生死的分水嶺。

前期,科學家派創(chuàng)業(yè)者往往憑借學術光環(huán)與技術積累,能迅速獲得資本的青睞。

但隨著公司進入商業(yè)化階段,投資人關注的重心轉向更直接的指標:訂單數量、客戶結構、落地案例。這時如果缺乏清晰的商業(yè)模型和市場抓手,融資鏈條會趨緊,企業(yè)的發(fā)展甚至可能陷入停滯。

科學家派的優(yōu)勢和短板會被同時放大:他們站在技術浪潮的最前端,卻也必須面對市場的冷峻檢驗。

未來,能否在保持科研前瞻性的同時找到明確的商業(yè)錨點,將決定科學家派究竟是引領具身智能的「開路者」,還是被迫止步于實驗室與 Demo 階段的「先行者」。

       原文標題 : 具身智能創(chuàng)業(yè)者圖鑒:科學家們,從象牙塔走向修羅場

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號