對話顧嘉唯：AI正在從虛擬世界，開始進入物理世界

本文作者：聰聰

2025-11-19 12:08

導語：“像特斯拉做FSD一樣，做具身智能。”

11月17號，AI+消費機器人公司靈宇宙宣布，已于近期完成2億元PreA輪系列融資，投資方包括滴滴出行、拉卡拉、上海國際、國泰海通、廣發信德等。這是靈宇宙繼去年包括三七互娛、商湯科技、線性資本等資本加碼后的又一輪系列融資。

不久前，我們在北京望京的辦公室，見到靈宇宙創始人顧嘉唯，并與他進行了一次深度對話。

“微軟亞研院研究員”“百度少帥”，百度IDL（深度學習實驗室）主任研發構架師，麻省理工媒體評論MIT TR35科技創新者，這是顧嘉唯曾經的標簽。

2016年，顧嘉唯加盟A股上市公司，出任副總裁，并擔任旗下公司物靈科技聯合創始人。彼時，顧嘉唯曾經接受雷峰網(公眾號：雷峰網)專訪，分享他對“萬物有靈”的設想。2023年，顧嘉唯重新創業，創辦靈宇宙，延續他的創業愿景。

新的公司“麻雀雖小，但五臟俱全”。在不足百十平方米的會議室，有一幅漫畫格外顯眼，它被放置于房間門口。這幅畫暢想了人類未來的生活：機器人可以端茶倒水，可以成為育兒嫂，可以做幾乎一切人所需要的服務。

對話顧嘉唯：AI正在從虛擬世界，開始進入物理世界

顧嘉唯說，這是他從第一次創業就想做的事情，但當時的時間點比較早。當下，隨著大模型的快速發展，到了做這件事的timing。

顧嘉唯這樣解釋他在做的事情，“World as prompt， World as interface。（把世界變成一個提示詞，把世界變成一個交互界面)”。

在顧嘉唯看來，今天最大的一個機會就是，AI 從虛擬世界和電腦屏幕，走到下一個階段，解決物理世界的問題，利用物理世界的數據來讓 AI 進入智能涌現的下一步。

在商業化路徑上，靈宇宙選擇以消費級AI硬件先行切入家庭場景，優先于復雜人形機器人實現規模化落地，構建起類比特斯拉FSD的“南坡路徑”。

顧嘉唯表示，以前其實從大模型 GPT 3 ，到今天我們看到的所有發展，是來自于涌現于線上的文本數據，人類創造的互聯網數據跟模型的關系。

一旦我們能走到下一步，我們定義的這套空間交互大模型，基于空間的行為動作模型關系去構建，就能實現說今天所說的具身也好，空間智能也好，最稀缺的一部分數據供給。但前提是我們得像特斯拉做FSD 一樣，能夠先鋪量，先把足夠多的設備布出來，才能構建這個閉環。

顧嘉唯坦言：“我是很篤信這件事的。因為對我來說，未來我要最終實現海報上面那樣的場景，你的養老，你的育兒，都是可以讓機器人去輔助完成。用AI機器人來解決人和家庭的關系變得更簡單，把重復勞作和娛樂陪伴各方面都分擔一部分給出去，讓成長快樂和天倫之樂回歸人性的簡化，這是我認為再往下發展很有可能會出現的一個變化，它會改造人類家庭常規的交互方式。”

從繪本閱讀機器人的開創者Luka（盧卡），到隨身AI終端“靈宇宙小方機”，顧嘉唯以及靈宇宙正沿著他們的既定路線，不斷向著未來的愿景前進。

以下是雷峰網AI科技評論等媒體與顧嘉唯的對話

一、融資主要用于團隊升級，但不追求公司規模

Q：首先恭喜完成新的融資。您能否透露本輪融資主要將用于哪些重點方向？比如是技術研發、市場推廣還是海外擴張？

A：我們的資金主要用于研發，市場投入等方面，包括人才招聘，主要是要招人。因為我們原來的團隊其實是上一個周期迭代經驗沉淀下來的資源和人脈，也確實是適配于今天這個大模型做 AI 硬件或者 AI 消費電子或者 AI 機器人的路徑。

這個賽道不像純 AI 軟件，來一個新的玩家就能夠快速做起來，因為現在積累厚度還是蠻厚的。但是我今天也遇到新的一些挑戰和問題，比如海外，我們現在要更加速我們的海外整個商業化落地，那我們要去找到更多的海外跨境的人才。以及當商業化的時候，我們發現我們 GTM （ go to market）做商業化規劃這部分能力要求，不論是國內還是海外，我需新的打法，因為這個品類是新品類，以前沒有過。

Q：具體要怎么做新品類的市場推廣？

A：比如怎么以一個像蘋果一樣方式去落地商業化。我們要有很強的發布能力，把所有每次軟件功能的升級和硬件的版本都能發布出去，以及下面能承載專營店、體驗店。因為新品類是重體驗。

舉個例子，比如說Apple Vison Pro，要先用手機、用蘋果先注冊完人臉驗證之后，然后到線下才能體驗預約才能實現。

那人才維度也需要升級，我們也希望說能夠在這次不斷地拿到新的資本來加持的時候，能夠引入這樣的品類創新人才。我們目前40人+團隊，已經實現了這樣一個階段性成果，我覺得這也是未來AI公司的一個普遍情況，用AI賦能團隊，然后持續找到創新人才。

Q：之前物靈科技有幾百人，這次創業人好像少了很多。未來團隊規模未來預計擴大到多少人？有怎樣的考量？

A：目前沒有太明確的數字，因為說實在我覺得現在跟以前不一樣。以前公司成立第一天，我們就 300 號人的團隊，是因為當時有孵化的項目以及并購的項目弄到一起了。現在，我對于人員和對于控制要求都比較高，你能感受到，我們其實是很緊湊高效的一個創業氛圍，跟上一個周期是不一樣的。這跟今天的外部環境，以及跟我的經歷都有關系。

我走過這些中間的起起伏伏的路之后，我再選擇這邊，對人員的整體規劃是沒有的，我更希望是一個人能多用的，因為大模型時代， AI native的公司一定是很多東西不需要自己干，模型就可以幫你解決。但我會找到關鍵人，有些關鍵的需求的人員是對我比較重要，通過原來的人脈沒有 reach 到的，通過資本市場的獲得更大的股東的人脈，以及說我們通過更多人知道我們在今天這個公司在做什么，我們可以吸引到更多這樣的人才。

Q：和投資人或機構交流的過程當中，您最大的感受是什么？現在具身智能這么火的市場環境下，您會有危機感嗎？

A：我覺得可能今天在我們這個公司的股東結構里面，這些機構有一個讓我印象特別深的地方，就是從質疑到最后印證的一個過程。

一開始當我說要去走一個特斯拉 FSD 的南坡路徑，去鋪硬件、收數據，可能最終我也要去做端茶倒水這種機器人形態時候，大家覺得好像沒有一個連接線過去。但當大家看到我們產品落地的過程，使用的交互形式和它開始鋪量不斷做增長這個過程，當大家發現Meta小扎和Google等前沿實驗室最近的關鍵動作的時候，大家發現這件事情其實是一個有通路的東西，我覺得這反而是我認為大家印證了一個終局思維的方式做一家公司的一些不一樣的路徑。

Q：怎么理解這個終局思維？

A：其實，我先去定義的一個終局思考，然后回過來再畫出兩個roadmaps，然后一點點走過去的，這其實是個非共識的過程。我覺得今天我感受到這些股東能加碼，也有老股東加持，也有新的進來。

大家看到了一個機會，他發現其實一開始被質疑的和不確定的這些東西逐漸一點點被印證出來，我覺得這是我感觸最深的一點。

中間我們每一步的這個過程，讓大家看到了說這件事真的是在發生的，這個南坡路徑是在發生的，這種輕量級的終端能采集數據，完成構建今天具身智能和世界模型里面最缺失的真實數據閉環，是我覺得可能大家逐漸已經從一個從非共識到加注的一個重要因素。

Q：作為公司老股東，您也提到與商湯的合作，能不能具體展開介紹一下這方面的合作有哪些關鍵性進展？下一步還會有沒有什么延伸？

A：商湯的優勢在于他們能夠把以前的計算機視覺這部分的數據源和計算機視覺基因搭建的這種多模態大模型引擎和模型的能力賦能給我們，所以在我們看到的 real time 的實時交互的大模型上面，能做到這么好的體驗，換任何一個非深度合作的模型公司是很難做到的。所以對我的好處在于，啟動的時候有一些全新的多模態的交互數據體驗是在別的基模（比如字節的豆包或者是阿里的通義）實現不到的深度的體驗。另外一個比較重要的優勢，大家知道其實最早啟動的時候，商湯的集群卡也比較多，所以我們會比較在意是怎么應用它現在最新的 SenseNova模型，怎么能夠通過算力的加速盡快應用到消費電子里面，這是我們可能一起會耦合去迭代的一個方式。

二、預測未來最好方式就是去做它

Q：商業化這一塊有什么具體戰略上面的想法嗎？

A：國內的抖音是很強大的一個過去的積累，你會發現視頻電商的算法推薦以及說視頻內容的展現效率 3 ~ 10 秒鐘，進來捕捉完之后持續結單和下單，這種效率在國外其實反而學中國的。

因為抖音我們其實過去也做過好多年，反而北美那邊或者說東南亞那邊，或者說像歐洲有點難，還沒有完全起來，在視頻電商和興趣電商的這個環節，我們反而是有過經驗之后，只要復制這個經驗，找對那邊的人就行。我覺得這個套路其實是可以通達的。

其實像我們這樣重體驗的產品不是一個標品，我覺得國內已經有過積累的公司是反而會彎道超車的，我覺得這是有好的一面的可能性。我們往下走，海外市場是有積累的能力的，因為媽媽類的產品、母嬰類產品，這兩個都打得是很透的。其實既有做過微商，也有做過抖音的直播帶貨的流量模式，都打過一遍實操的經驗。

Q：我們如何維持產品的壁壘和厚度？

A：今天這個大模型時代有兩個關鍵詞。

第一是極致個性化適合每個人，絕對做到千人千面。以前千人千面，字節時代是推薦算法，一個內容創造出來，在云端通過推薦函數連接給你，今天我們把它定義叫“關系算法”，也就是說這個角色更懂你，因為這個角色跟你共同經歷。跟你互動更多的Agent智能體，他會更懂你的情況，他會主動來和你交互。我們在過去把所有的角色主動適配的能力建立起來，讓每個角色可以主動的適合每個人。然后，他長期的記憶，主動的意識都可以交互起來。那我覺得是今天大模型跟隨的公司沒有這樣的技術積累能力是做不到的這點的。

第二是數據的伴隨AI原住民成長的長期周期。為什么我們能做到小方機，就是用過去盧卡積累過數據和用戶洞察。當年人口紅利高峰期的產品用戶，今天長大了，正好從盧卡過渡到小方機，我們會通過靈宇宙的AI終端不斷迭代升級去靈性陪伴這一波Alpha世代人群（10后）共同成長，盧卡的數據已經在這邊放量成為了一個看得見的結果，那進一步就在堆積這個產品，下一步的數據源來讓他繼續領跑和成為下一個閉環的優勢。

Q：漫畫里面機器人繞膝左右場景，您覺得未來多長時間會實以實現這樣一個場景？

A：我覺得我很喜歡 Alan key （連線雜志作者）的兩句話。

第一句話是，"The best way to predict the future is to invent it."（預測未來最好方式就是去發明它。）

我覺得這是讓我自己比較幸福的一句話，因為我覺得時間軸很難預判，人們對技術的科技發展很容易高估短期，低估長期做的事情。所以我覺得這個時間線我覺得挺難判斷，但我會一直在履行實踐、試錯、迭代這件事。

從盧卡，到今天的小方機。大家會說你不是做機器人嗎？怎么搞了一個這個玩意出來？我其實在用我的時間路徑再去履行這樣事情。

第二句話是，"People who are serious about software should make their own hardware."（如果你執念要去做出好的軟件體驗來，請去做硬件。）

所以你會發現，如果從投入度和價值資產的角度來看，我們是軟件占80% 的公司，硬件反而只占20%。但是，我們產品是以硬件的方式在這個人群里面有專有需求。做AI硬件要離手機遠，一種離手機遠的方式就是干這種端茶倒水的這種實體硬件解決原子交互問題。第二種是要離手機遠，是那個人群沒有手機或者家長不想給他手機，他需要專業設備。例如今天家長想給孩子用豆包，又擔憂給了手機會去打游戲的痛點，這兩個都是我覺得比較重要的做AI硬件的底層思考。

回過頭來，我會覺得，既然是軟件，我不怕迭代，我只要高密度的錨準我認為的核心邏輯去迭代軟件，我一定是會排活在牌桌上，成為做成這家公司的人，所以你會發現其實“穿越周期有韌性”是很關鍵的，“識別機會和timing”又是很關鍵的。

Q：如何解決大模型“幻覺”在具身機器人上的風險？

A：幻覺問題在過去的一年多時間是有大規模的降低的，其實有很多解法基模已經在解了，底層的基模都在幫你解決，所以它是個時代給予的機會。我們還有過去那么多年做盧卡積累的模型微調和數據經驗。

Q：您目前創業做家用機器人，比較擔心的是什么?

A：我會擔心的是，當這個攝像頭在真實界你交互的時候，你會發現其實這個數據源的優勢是會被場景的割裂而影響，因為孩子會各種跑動、遮擋環境等，這部分東西是不可控的，而且有很多好的模型，高算力的方案，放到家長買給孩子產品也有難度。有很多最新的模型未必能用得上，所以每一項的環節體驗都有可能出現打折的地方，遇到很多挑戰，這種挑戰是把事做好的，一個會有的難度和微妙的痛苦，我覺得這痛苦是一個創業者要去解決的。

另外我覺得孩子類的東西，他反而對數據隱私是很敏感的。這東西是會持續收集，會把一天當中所有的東西記下來壓縮，然后整理，跟你互動，其實今天會有很多這樣的隱私的不確定性。比起跟別人同質化競爭，這是我更在意的東西。

本文作者代聰飛，既看產品，也看人與業務的故事，持續關注AI行業的潮水方向。歡迎各位讀者添加作者微信Congc_a交流。

雷峰網原創文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

聰聰

主筆

個人微信：Congc_a，歡迎添加交流。

發私信

當月熱門文章