對話馮雷：從 AI 播客，到真人感 Agent

本文作者：成妍菁

2026-02-28 18:00

導語：創作只需1%的靈感，我們負責100%的放大。

當下AI圈幾乎每周都有新鮮事發生，這反而給了許多創業公司熬出頭的機會。（雷峰網雷峰網雷峰網(公眾號：雷峰網)）

無論是Clawedbot掀起對物理世界交互方式的重構，還是Moltbot上開始討論AI和人類如何共存的危機感，都在提醒市場：真正的機會往往藏在邊緣地帶，以及看似微小的‘非共識’時刻。

比如“播客”這個領域，即便有短視頻和短劇的大力沖擊，但是播客賽道仍舊火熱，根據《CPA中文播客白皮書2026》顯示，2025年中文播客聽眾人數已突破1.5億人，較2023年的1.2億增長25%。

在大量研究國外對播客的論文文獻之后，創始人馮雷決定選擇AI播客這條賽道，其創業路徑非常清晰：我們的目標不是DAU，而是要做一個賺錢的 AI 產品，專注于 1%-3%以內的創作者，這群人很有創造力，也愿意付費，我們就服務這群人。

“我們就是希望他像一個真人一樣，沒有太多 AI 表達。盡量有人味，越自然越好?！?馮雷對AI科技評論表示。

對話馮雷：從 AI 播客，到真人感 Agent ListenHub創始人馮雷

作為一家在播客生成領域做到國內頭部的公司，ListenHub 選擇為內容創作者提供聲音克隆、多模態編輯、一鍵生成解說視頻等專業工具。

公司去年底實現了300萬美金的ARR，并在近期以5000萬美金的估值開啟新一輪融資。

在成為一名創業者之前，馮雷是Minimax 海螺AI的產品負責人，最廣為人知的是他的個人公眾號“有機大橘子”，更早期在BOSS直聘、蘭亭集勢、三星等公司就職就職，從事產品經理相關職位。

在對PMF的理解上，他指出：在傳統互聯網時代，產品經理的核心任務是"發現需求-驗證模型-規?；瘡椭?quot;，流程清晰如流水線；而在AI時代，他坦言這套方法論已經失效——"真的是拿錘子找釘子，而且還真的能找到"。

這種反常識的顛倒，源于大模型作為通用技術的特殊性，因此在招聘時，馮雷也會警惕經驗主義者，"3年以上的產品經理容易陷到過去的方法論里"；他堅持定ARR而非DAU目標，也會將產品核心交給工程師和AI本身，信奉Manus那句"less structure, more intelligence"——當技術本身具備涌現能力時，人的任務不是控制，而是守護那1%的靈魂。

在這次對話中，馮雷展現了一個AI創業者的清醒與坦誠。他不諱言對大模型降本論的質疑——"去年大家最大的錯誤判斷就是相信模型降價能帶來利潤空間"；他也直言當前AI應用公司的困境——"調用Claude的公司利潤都很低，ARR只是給Claude交的稅"；他甚至略帶自嘲地承認"現在的英文模型效果依然不夠好，一定程度上影響了海外的 GTM"。

這篇對話記錄不僅是對ListenHub成功的復盤，更是為當下AI創業者呈現出的另一個參考樣本：

01 關于ListenHub產品現狀

AI科技評論：ListenHub目前進展如何？在市面上各種AI產品都在卷DAU的時候，你們怎么選擇？

馮雷：去年底我們做到了300萬美金的ARR，和豆包相比，它的目標是做中國DAU第一的AI產品，做的是大眾生意。但我們的目標是做一個賺錢的AI產品。我們服務的核心人群可能只占全網用戶的1%到3%，就是那些有創造力、愿意付費的創作者。我們增加了聲音克隆、編輯模式等他們需要的功能，這樣與大廠形成正交關系，沒有直接競爭。

AI科技評論：既然是給創作者用的工具，為什么選擇“AI播客”這個切入點？短視頻不是更火嗎？

馮雷：播客是一個很神奇的存在。短視頻沖擊了這么多年，聽播客的人不僅沒少，反而變多了。這說明它里面有一種不可替代的“深度表達”需求。

ListenHub做到了國內第一，核心特色在于“像人一樣自然的表達”。我們不是在做表演，而是在做溝通?，F在的AI能把解說視頻做得非常有“人味兒”，這種自然感是用戶買單的關鍵。而且，我們正在從音頻向視頻、PPT拓展，流量池會更大。

AI科技評論：ListenHub的商業模式是一開始就確定的嗎？

馮雷：是逐漸在創業過程中探索而來的。最初嘗試情感電臺方向——AI個性化推送情感故事，支持聊天并按對話收費。但該方向用戶付費意愿有限，工具屬性反而更易變現，因此自然轉向迭代，逐步加入視頻、圖片、解說等功能。

02 技術路徑與產品體驗

AI科技評論：你們現在主要使用哪些模型？國內外模型使用的差異性在哪里？

馮雷：我們主要用海外的原生多模態模型。比如把PDF或Youtube視頻直接“洗”成一篇高質量的播客稿件，這需要極強的長窗口和多模態理解力。

我們也會用到一些國內的模型，比如Qwen、Minimax、字節（豆包）在中文處理上都不錯。但問題出在英文和多語言上。因為我們要出海，服務海外用戶和海外華人，所以必須依賴海外模型。

AI科技評論：產品最主要的技術指標是什么？是聲音還原度還是文本流暢？

馮雷：分幾塊：文本方面希望像真人一樣，沒有太多"AI味"；聲音方面越自然越好，保持播客輕松的狀態；圖片方面要給用戶足夠信息量，同時精美并符合用戶要求。

AI科技評論：讓AI"沒有人味"是通過提示詞工程實現的嗎？

馮雷：整體是一套標準的"上下文工程"。前置處理包括各種輸入（YouTube、PDF等），基于講解場景整理核心信息，然后按照播客場景處理。分兩步：一是搭架構（像建房搭結構），二是潤色表達（像裝修和外墻），最終形成好內容：第一，要有信息量、有干貨知識性；第二，表達要吸引人，能讓人聽完（比如3分鐘完播率），內容再好沒人聽也不行；第三，要有內在邏輯，讓人聽完能改變行為。對創作者來說，還需要節奏、韻律，讓粉絲聽完想聽下一個，這三者要結合。

03 商業模式與創業思考

AI科技評論：現在市場上有做“套殼”集成的（如Manus），也有自研模型的，這兩種模式怎么看？

馮雷：如果錢足夠，還是會訓模型。模型公司追求更高的上限，比如Coding是個大市場，只有自己訓模型，在大規模用戶下利潤率才算得過來。應用公司調用API（如Claude）其實很難有高利潤，大部分收入都交給模型廠商了（像交稅一樣）。

AI科技評論：既然模型成本這么高，前兩年說的“模型降價”似乎沒有給應用公司帶來特別大的成本空間？

馮雷：這可能是去年大家最大的錯誤判斷。降價發生在模型能力到達閾值之前，那時候模型沒那么有用，只能靠降價擴張，或者像OpenAI這樣追求超高速覆蓋率。但一旦突破閾值（如谷歌的圖片模型，一塊錢一張圖，很貴，不降價都供不應求），頂級模型就變成了商品。

AI科技評論：所以現在做應用必然燒錢？

馮雷：會燒錢，但要合理地燒。不能像互聯網時代那樣免費換規模。AI時代沒有網絡效應，必須建立健康的經濟模型。

AI科技評論：公司目前融資進展如何？資金可支撐多久？

馮雷：正在推進新一輪融資，上一輪天際投完之后估值達到約2000萬美元。Q4 ARR增至300萬美元，本輪按5000萬美元估值進行融資，年底目標估值1億美元。

當前資金可支撐兩年以上。下一輪融資完成后可支撐五年。

AI科技評論：創業公司資金有限，如何控制成本？

馮雷：主要成本在Token上。我們設定規則：任何創業項目初始預算為1000美元Token費用。若上線一天內耗盡，說明項目有潛力，公司追加投資；若項目走紅但成本可控，也不會造成損失。以預算作為約束機制，核心目標是ARR。

該機制自去年10月"任務酒館"改革后實行。任務公開發布，成員自主認領，獨立完成從開發到驗證的全流程，預算內API費用實報實銷。

但嘗試也需要主線和方向。我們的主線是幫助人表達——通過多模態技術增強表達能力。技術與人文結合，目標人群明確（創作者、學生、教師），在此范圍內可自由嘗試，但需避免偏離核心（如短劇屬于表演而非表達，不在范圍內）。

04 AI時代的產品方法論

AI科技評論：如果中廠、大廠把TPMF做得很好，純做PMF的公司會受到沖擊嗎？

馮雷：訓模型的公司普遍開放API，因其自有場景不足，需要用數據持續優化模型。模型公司與我們合作時也會協助微調模型，目標同樣是提升模型能力。因此在這一層面，雙方利益一致——場景上各取所需，ROI不同，但都希望用數據讓模型更強。若模型公司真能覆蓋所有場景，便不會開放API。

AI科技評論：AI時代做產品，與過去尋找PMF有何不同？

馮雷：完全不同。過去需求與技術相對確定，產品只需找到連接點，固化workflow，發現盈利路徑后迅速規?；?，借助網絡效應擴張。

AI時代則相反：用戶場景與模型訓練者的預設往往不一致，因此產品、運營、增長都無法先設定明確目標。例如馬卡龍初期專注寫作，但模型能力未達預期，方向錯誤只能放棄。

邏輯是倒置的：先構建通用技術，投入市場驗證，發現匹配場景（如PPT高頻且有價值），再針對性完善工程。這類似于"拿錘子找釘子"，雖反常識，但通用技術確能找到適配場景。因此我們傾向招募3年以內經驗的產品經理，資深者反而易受舊有方法論束縛。

AI科技評論：在MiniMax時的產品思路與現在一致嗎？

馮雷：當時尚處Chatbot早期，產品目標是服務模型迭代——獲取數據、構建飛輪、提升模型能力，不關注產品數據或營收，只追求技術上限。

當前環境對產品經理挑戰更大：技術變量不由產品主導，因此需摒棄 ego。我們公司工程師地位很高，擁有充分決策權。我不會以15年產品經驗自居進行指導，而是聚焦目標設定。目標選擇至關重要——DAU目標會導致團隊動作變形，ARR 目標在前兩年都更有效，因其倒逼真實增長與付費轉化。

我們正培養工程師的端到端能力：從用戶需求驗證（工程師直接參與用戶社群）、商業模式設計到產品上架，全流程參與。將產品經理培養成全棧成本過高，而將工程師培養成具備產品決策能力的全棧人才更具性價比，這是我們的核心方法論。

AI科技評論：公司當前主線是什么？是否會涉足數字人和陪伴類產品？

馮雷：數字人和陪伴類暫不涉及。完成現有表達類產品后，我們認為智能表達已較為成熟。長期目標是構建Agent——本質上是模擬完整的人。除表達外，還需具備思考能力、意圖理解能力和執行能力。表達能力已夯實，現正推進完整Agent的研發。

內部從去年8月開始就已經在開發一款語音交互驅動的桌面 Personal Agent產品，支持語音對話，長期記憶，控制電腦，使用網絡。我們將 ListenHub 里積累的真人感的表達理念和技術積累注入到全新的 Agent產品中，力圖打造出第一個具有真人感的 Agent。

目前該產品正在緊張的內測中，最早在春節后會跟大家見面。（本文作者長期關注AI應用以及創業者故事，歡迎加微信Who123start暢聊探討）

雷峰網原創文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

成妍菁

編輯

發私信

當月熱門文章

對話馮雷：從 AI 播客，到真人感 Agent

對話馮雷：從 AI 播客，到真人感 Agent