0
當下AI圈幾乎每周都有新鮮事發生,這反而給了許多創業公司熬出頭的機會。(雷峰網雷峰網雷峰網(公眾號:雷峰網))
無論是Clawedbot掀起對物理世界交互方式的重構,還是Moltbot上開始討論AI和人類如何共存的危機感,都在提醒市場:真正的機會往往藏在邊緣地帶,以及看似微小的‘非共識’時刻。
比如“播客”這個領域,即便有短視頻和短劇的大力沖擊,但是播客賽道仍舊火熱,根據《CPA中文播客白皮書2026》顯示,2025年中文播客聽眾人數已突破1.5億人,較2023年的1.2億增長25%。
在大量研究國外對播客的論文文獻之后,創始人馮雷決定選擇AI播客這條賽道,其創業路徑非常清晰:我們的目標不是DAU,而是要做一個賺錢的 AI 產品,專注于 1%-3%以內的創作者,這群人很有創造力,也愿意付費,我們就服務這群人。
“我們就是希望他像一個真人一樣,沒有太多 AI 表達。盡量有人味,越自然越好?!?馮雷對AI科技評論表示。
ListenHub創始人 馮雷
作為一家在播客生成領域做到國內頭部的公司,ListenHub 選擇為內容創作者提供聲音克隆、多模態編輯、一鍵生成解說視頻等專業工具。
公司去年底實現了300萬美金的ARR,并在近期以5000萬美金的估值開啟新一輪融資。
在成為一名創業者之前,馮雷是Minimax 海螺AI的產品負責人,最廣為人知的是他的個人公眾號“有機大橘子”,更早期在BOSS直聘、蘭亭集勢、三星等公司就職就職,從事產品經理相關職位。
在對PMF的理解上,他指出:在傳統互聯網時代,產品經理的核心任務是"發現需求-驗證模型-規?;瘡椭?quot;,流程清晰如流水線;而在AI時代,他坦言這套方法論已經失效——"真的是拿錘子找釘子,而且還真的能找到"。
這種反常識的顛倒,源于大模型作為通用技術的特殊性,因此在招聘時,馮雷也會警惕經驗主義者,"3年以上的產品經理容易陷到過去的方法論里";他堅持定ARR而非DAU目標,也會將產品核心交給工程師和AI本身,信奉Manus那句"less structure, more intelligence"——當技術本身具備涌現能力時,人的任務不是控制,而是守護那1%的靈魂。
在這次對話中,馮雷展現了一個AI創業者的清醒與坦誠。他不諱言對大模型降本論的質疑——"去年大家最大的錯誤判斷就是相信模型降價能帶來利潤空間";他也直言當前AI應用公司的困境——"調用Claude的公司利潤都很低,ARR只是給Claude交的稅";他甚至略帶自嘲地承認"現在的英文模型效果依然不夠好,一定程度上影響了海外的 GTM"。
這篇對話記錄不僅是對ListenHub成功的復盤,更是為當下AI創業者呈現出的另一個參考樣本:
01 關于ListenHub產品現狀
AI科技評論:ListenHub目前進展如何?在市面上各種AI產品都在卷DAU的時候,你們怎么選擇?
馮雷:去年底我們做到了300萬美金的ARR,和豆包相比,它的目標是做中國DAU第一的AI產品,做的是大眾生意。但我們的目標是做一個賺錢的AI產品。我們服務的核心人群可能只占全網用戶的1%到3%,就是那些有創造力、愿意付費的創作者。我們增加了聲音克隆、編輯模式等他們需要的功能,這樣與大廠形成正交關系,沒有直接競爭。
AI科技評論:既然是給創作者用的工具,為什么選擇“AI播客”這個切入點?短視頻不是更火嗎?
馮雷: 播客是一個很神奇的存在。短視頻沖擊了這么多年,聽播客的人不僅沒少,反而變多了。這說明它里面有一種不可替代的“深度表達”需求。
ListenHub做到了國內第一,核心特色在于“像人一樣自然的表達”。我們不是在做表演,而是在做溝通?,F在的AI能把解說視頻做得非常有“人味兒”,這種自然感是用戶買單的關鍵。而且,我們正在從音頻向視頻、PPT拓展,流量池會更大。
AI科技評論:ListenHub的商業模式是一開始就確定的嗎?
馮雷:是逐漸在創業過程中探索而來的。最初嘗試情感電臺方向——AI個性化推送情感故事,支持聊天并按對話收費。但該方向用戶付費意愿有限,工具屬性反而更易變現,因此自然轉向迭代,逐步加入視頻、圖片、解說等功能。
02 技術路徑與產品體驗
AI科技評論:你們現在主要使用哪些模型?國內外模型使用的差異性在哪里?
馮雷:我們主要用海外的原生多模態模型。比如把PDF或Youtube視頻直接“洗”成一篇高質量的播客稿件,這需要極強的長窗口和多模態理解力。
我們也會用到一些國內的模型,比如Qwen、Minimax、字節(豆包)在中文處理上都不錯。但問題出在英文和多語言上。因為我們要出海,服務海外用戶和海外華人,所以必須依賴海外模型。
AI科技評論:產品最主要的技術指標是什么?是聲音還原度還是文本流暢?
馮雷:分幾塊:文本方面希望像真人一樣,沒有太多"AI味";聲音方面越自然越好,保持播客輕松的狀態;圖片方面要給用戶足夠信息量,同時精美并符合用戶要求。
AI科技評論:讓AI"沒有人味"是通過提示詞工程實現的嗎?
馮雷:整體是一套標準的"上下文工程"。前置處理包括各種輸入(YouTube、PDF等),基于講解場景整理核心信息,然后按照播客場景處理。分兩步:一是搭架構(像建房搭結構),二是潤色表達(像裝修和外墻),最終形成好內容:第一,要有信息量、有干貨知識性;第二,表達要吸引人,能讓人聽完(比如3分鐘完播率),內容再好沒人聽也不行;第三,要有內在邏輯,讓人聽完能改變行為。對創作者來說,還需要節奏、韻律,讓粉絲聽完想聽下一個,這三者要結合。
03 商業模式與創業思考
AI科技評論:現在市場上有做“套殼”集成的(如Manus),也有自研模型的,這兩種模式怎么看?
馮雷: 如果錢足夠,還是會訓模型。模型公司追求更高的上限,比如Coding是個大市場,只有自己訓模型,在大規模用戶下利潤率才算得過來。應用公司調用API(如Claude)其實很難有高利潤,大部分收入都交給模型廠商了(像交稅一樣)。
AI科技評論:既然模型成本這么高,前兩年說的“模型降價”似乎沒有給應用公司帶來特別大的成本空間?
馮雷:這可能是去年大家最大的錯誤判斷。 降價發生在模型能力到達閾值之前,那時候模型沒那么有用,只能靠降價擴張,或者像OpenAI這樣追求超高速覆蓋率。但一旦突破閾值(如谷歌的圖片模型,一塊錢一張圖,很貴,不降價都供不應求),頂級模型就變成了商品。
AI科技評論:所以現在做應用必然燒錢?
馮雷: 會燒錢,但要合理地燒。不能像互聯網時代那樣免費換規模。AI時代沒有網絡效應,必須建立健康的經濟模型。
AI科技評論:公司目前融資進展如何?資金可支撐多久?
馮雷:正在推進新一輪融資,上一輪天際投完之后估值達到約2000萬美元。Q4 ARR增至300萬美元,本輪按5000萬美元估值進行融資,年底目標估值1億美元。
當前資金可支撐兩年以上。下一輪融資完成后可支撐五年。
AI科技評論:創業公司資金有限,如何控制成本?
馮雷:主要成本在Token上。我們設定規則:任何創業項目初始預算為1000美元Token費用。若上線一天內耗盡,說明項目有潛力,公司追加投資;若項目走紅但成本可控,也不會造成損失。以預算作為約束機制,核心目標是ARR。
該機制自去年10月"任務酒館"改革后實行。任務公開發布,成員自主認領,獨立完成從開發到驗證的全流程,預算內API費用實報實銷。
但嘗試也需要主線和方向。我們的主線是幫助人表達——通過多模態技術增強表達能力。技術與人文結合,目標人群明確(創作者、學生、教師),在此范圍內可自由嘗試,但需避免偏離核心(如短劇屬于表演而非表達,不在范圍內)。
04 AI時代的產品方法論
AI科技評論:如果中廠、大廠把TPMF做得很好,純做PMF的公司會受到沖擊嗎?
馮雷:訓模型的公司普遍開放API,因其自有場景不足,需要用數據持續優化模型。模型公司與我們合作時也會協助微調模型,目標同樣是提升模型能力。因此在這一層面,雙方利益一致——場景上各取所需,ROI不同,但都希望用數據讓模型更強。若模型公司真能覆蓋所有場景,便不會開放API。
AI科技評論:AI時代做產品,與過去尋找PMF有何不同?
馮雷:完全不同。過去需求與技術相對確定,產品只需找到連接點,固化workflow,發現盈利路徑后迅速規?;?,借助網絡效應擴張。
AI時代則相反:用戶場景與模型訓練者的預設往往不一致,因此產品、運營、增長都無法先設定明確目標。例如馬卡龍初期專注寫作,但模型能力未達預期,方向錯誤只能放棄。
邏輯是倒置的:先構建通用技術,投入市場驗證,發現匹配場景(如PPT高頻且有價值),再針對性完善工程。這類似于"拿錘子找釘子",雖反常識,但通用技術確能找到適配場景。因此我們傾向招募3年以內經驗的產品經理,資深者反而易受舊有方法論束縛。
AI科技評論:在MiniMax時的產品思路與現在一致嗎?
馮雷:當時尚處Chatbot早期,產品目標是服務模型迭代——獲取數據、構建飛輪、提升模型能力,不關注產品數據或營收,只追求技術上限。
當前環境對產品經理挑戰更大:技術變量不由產品主導,因此需摒棄 ego。我們公司工程師地位很高,擁有充分決策權。我不會以15年產品經驗自居進行指導,而是聚焦目標設定。目標選擇至關重要——DAU目標會導致團隊動作變形,ARR 目標在前兩年都更有效,因其倒逼真實增長與付費轉化。
我們正培養工程師的端到端能力:從用戶需求驗證(工程師直接參與用戶社群)、商業模式設計到產品上架,全流程參與。將產品經理培養成全棧成本過高,而將工程師培養成具備產品決策能力的全棧人才更具性價比,這是我們的核心方法論。
AI科技評論:公司當前主線是什么?是否會涉足數字人和陪伴類產品?
馮雷:數字人和陪伴類暫不涉及。完成現有表達類產品后,我們認為智能表達已較為成熟。長期目標是構建Agent——本質上是模擬完整的人。除表達外,還需具備思考能力、意圖理解能力和執行能力。表達能力已夯實,現正推進完整Agent的研發。
內部從去年8月開始就已經在開發一款語音交互驅動的桌面 Personal Agent產品,支持語音對話,長期記憶,控制電腦,使用網絡。我們將 ListenHub 里積累的真人感的表達理念和技術積累注入到全新的 Agent產品中,力圖打造出第一個具有真人感的 Agent。
目前該產品正在緊張的內測中,最早在春節后會跟大家見面。(本文作者長期關注AI應用以及創業者故事,歡迎加微信Who123start暢聊探討)
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。