vivo胡柏山：在焦慮的AI時代，交一份最“冷靜”的答案

本文作者：馬廣宇

2026-03-27 19:15

專題：全面突破 vivo NEX

導語：“算力終將同質化，感知才是護城河??”

從2023年開始，三年時間，中國科技產業開啟了所謂的"大模型狂飆時代"。

自ChatGPT引爆全球AI熱潮以來，中國科技行業迅速陷入了一場前所未有的集體焦慮。從互聯網巨頭到傳統制造業，從手機廠商到汽車新勢力，都試圖與"大模型"或"生成式AI"概念建立關聯，參數規模從千億躍升至萬億，戰略合作的簽署儀式頻繁見報。

DeepSeek的爆火恰好再次印證了這一觀點，在行業落地方向尚未明確時，各行各業均選擇了“先上車后補票”的方式乘上這趟“快車”。

不可否認的是，AI是現今科技產業最重要的發展方向之一，但在這場集體性的非理性繁榮中，冷靜思考變成了一件奢侈的事，畢竟沒有人愿意被貼上"錯過AI時代"的標簽，哪怕這種焦慮的來源本身就是對技術變革的過度反應。

今年春節開始，OpenClaw又掀起了一陣AI熱潮，只是在短暫的繁榮后，熱度又開始悄然退下。這是每一個新技術的終局，同樣也是對技術浮躁、焦慮的代價。如何讓AI理解世界、理解用戶、理解任務，這些基礎問題仍沒有人做出回答。

這是一個需要長期投入、難以短期變現、無法靠發布會解決的問題。正因如此，大多數企業選擇回避，轉而將資源投入到更具傳播效應的"追熱點"策略中。

vivo是少數選擇正面回答這個問題的企業。

2026年3月，博鰲亞洲論壇。vivo總裁、首席運營官胡柏山在演講中明確表示："我們把核心資源聚焦在端側AI和產業鏈協同，思考用戶在AI時代真正需要什么樣的體驗。"

這番表述可以視為一家成熟企業對技術趨勢的理性判斷。

如果我們仔細審視vivo過去五年的技術布局和戰略選擇，會發現這家企業正在下一盤遠比"發布大模型"更為深遠的大棋：感知能力賽道。

感知能力，是vivo對"AI時代競爭核心"這個問題的回答。

感知能力為什么是AI時代的競爭核心？

"在未來AI時代，算力、模型能力不具備差異化"。胡柏山的判斷，也是vivo感知戰略的決策基礎。

在vivo看來，隨著芯片工藝持續進步和模型架構不斷優化，算力和模型能力將會供應鏈化，每個手機廠商都有更多選擇權，不再構成競爭壁壘，而這一點也正在被行業驗證。

2024年至2026年間，聯發科、高通、蘋果、三星等主流芯片廠商的旗艦SoC在AI算力上持續快速提升。與此同時，高通驍龍系列、蘋果A系列的自研神經網絡引擎也在同步演進。這意味著，端側AI的算力基礎正在快速走向同質化。

在模型層面，開源社區的貢獻同樣不可忽視。Meta的Llama系列、Google的Gemma系列、阿里云的Qwen系列等開源大模型，已經能夠提供接近閉源模型的性能表現，且授權費用極低。對于手機廠商而言，基于開源模型進行微調，正在成為一條可行的技術路徑。

一個邏輯是，當算力和模型都不再是稀缺資源，企業就必須尋找新的差異化方向。vivo給出的答案是：以影像為基礎，構建AI落地物理世界的視覺感知中樞。

今年開始，vivo內部就已經對感知賽道進行立項，核心是把視覺、聽覺、觸覺等感知，通過傳感器加以感知大模型，轉化成AI想要得到的物理世界的信息。

所謂"數字世界連接物理世界"，指的便是AI理解、分析、處理物理世界信息的能力。一張圖片中的光影關系、一段視頻里的空間結構、用戶臉上的情緒變化。這些物理世界的感知信息，需要被AI"翻譯"成可理解、可分析、可決策的數字信號。

胡柏山的看法是：真正的差異化，在于誰數字世界連接物理世界的能力越強，誰就越'聰明'。而這恰巧是vivo的強項所在，過去十年，vivo在影像上做了巨大投入，除了讓照片變得更好看，同樣也是在建立一套完整的物理世界感知系統。

這套感知系統的技術架構，包含三層架構：

第一層是光學系統——鏡頭光學設計、鍍膜工藝、光學防抖等技術，決定了"看得到"的邊界。vivo與蔡司的深度合作，正是這一層的戰略投資，雙方持續在光學設計、鍍膜工藝、色彩科學等領域深化合作。

第二層是成像處理——ISP算法、HDR融合、多幀降噪、色彩科學等技術，決定了"看得清"的能力。vivo自研的V3影像芯片，專門針對這一層進行了算力優化。V3采用了先進的6nm制程工藝，AI算力相比前代提升40%，能夠支持4K級別的實時畫面增強。

第三層是感知理解——場景識別、語義分割、空間建模、情緒感知等AI能力，決定了"看得懂"的深度。這是vivo感知戰略的核心差異化所在。在這一層，vivo的藍心大模型矩陣發揮著關鍵作用。藍心大模型是vivo自主研發的多模態AI模型系列，能夠對圖像和視頻內容進行深度理解，識別物體、場景、關系、情緒等多維信息。

三層能力的疊加，使vivo的手機成為一臺真正意義上的"物理世界感知終端"。當用戶舉起手機拍照時，不僅在記錄一個瞬間，更是在讓AI"觀察"和"理解"當前的物理場景。

這種感知能力的長期價值，遠超一款手機的功能升級。vivo認為，當未來AI真正深入到千行百業時，具備強大感知能力的終端將成為最重要的數據入口，這也意味著感知能力賽道的競爭，已經悄然開始。（雷峰網）

vivo的Agent Phone藍圖

在博鰲亞洲論壇，胡柏山指出——Smart Phone 將進化成Agent Phone。

什么是Agent Phone？用vivo的理解，這是一種能夠主動理解用戶需求、自動完成任務、智能調度服務的下一代智能手機。

這與"智能手機"有著本質區別。智能手機的核心是"工具"：人使用手機來處理任務、獲取信息，手機始終處于"被動響應"的狀態。但Agent Phone的核心是"伙伴"：手機主動感知環境、理解需求、預判行動，成為真正懂你的智能代理。

這個轉變的關鍵驅動力，依然是感知能力。

當前智能手機的交互邏輯，本質上是"輸入-反饋"模式：用戶發出指令，手機執行并返回結果。整條交互鏈路是離散的、事件驅動的。但Agent Phone的交互邏輯將是"感知-理解-行動"：手機持續感知環境和用戶狀態，在后臺構建對當前場景的深度理解，然后主動提供最合適的響應和服務。

vivo對于Agent Phone有著超前的理解，但距離落地仍有許多現實問題需要解決。

首先是意圖理解，手機需要從用戶的模糊表述甚至無表述行為中，準確推斷用戶的真實意圖。這要求端側AI具備強大的上下文理解能力和長程記憶能力，能夠綜合用戶的歷史行為、當前位置、時間狀態、日程安排等多維信息進行綜合判斷。

其次是任務規劃能力，當確認用戶意圖后，手機需要自動拆解任務步驟、調用相關App和數據、在后臺完成復雜操作流程，并在必要時向用戶確認關鍵決策。這需要手機具備跨App、跨服務的任務編排能力。

最后是隱私邊界問題，在 vivo 看來這是不可逾越的底座。主動服務意味著手機需要持續感知和分析用戶狀態，Agent Phone需要在隱私保護和服務能力之間找到平衡點，做到既能提供足夠智能的服務，又要確保用戶對數據的控制權。

vivo的解法是將感知和推理過程盡可能保留在端側。胡柏山透露，vivo正在與芯片廠商、算法公司、學術機構深度合作，共同定義面向端側AI的新一代算力架構。"單靠手機廠商自己做不了端側AI，必須拉著產業鏈一起做。"

與Arm 建立聯合實驗室，與聯發科從底層硬件到軟件的多層面聯合研發,包括性能、AI、影像、游戲、通訊還有多媒體等各個領域；而在學術層面，vivo與清華大學、北京大學、上海交通大學等高校建立了深度合作關系，在端側AI的基礎研究上持續投入。

Agent Phone的底層支撐，是端側AI的意圖理解能力和感知系統對環境的實時建模。兩者的結合，使手機能夠在本地完成對用戶需求的理解、規劃和執行，既保證了響應速度，又保護了用戶隱私。

vivo在博鰲論壇上宣布，搭載相機Agent能力的新一代旗艦機型X300 Ultra 與X300s即將發布。除了專業的影像能力進一步提升，從某種程度來說，這也是Agent Phone的階段性成果展示。

但胡柏山明確表示，Agent Phone只是起點，不是終點。

"X300 Ultra會展示Agent Phone的核心能力，但它還不是終極形態。"他在專訪中透露，"真正的Agent Phone需要感知能力、端側AI、IoT生態的完整配合，這需要一個更長的建設周期。"

在vivo的戰略藍圖里，感知能力的價值遠不止于手機。

用感知，成為IoT生態的“眼睛”

在vivo的生態藍圖里，手機不是終點，而是起點。用胡柏山的話："以影像+AI構建的視覺感知中樞，可以升級為IoT生態的視覺感知中樞。"

在vivo看來，IoT行業有著難以解決的問題，單個智能化設備的感知過于片面，最終導致這些設備都缺乏一個共同的"感知中樞"來整合多維信息、構建統一理解。vivo認為，手機可以承擔這個角色。

當手機具備強大的視覺感知能力，它可以成為IoT生態的"眼睛"——通過與各類IoT設備的互聯互通，匯聚來自不同維度、不同位置、不同視角的感知信息，形成對用戶生活場景的完整理解。

"你的手機看到你在客廳，它就知道你的電視、音箱、空調應該怎么調整。"胡柏山舉例道，"但這只是第一步。未來，手機的感知能力會延伸到更多品類，讓更多設備'看見'這個世界。"

這種"感知延伸"的戰略，需要新的產品形態作為載體。

去年，vivo成立了機器人Lab，其成員來自無人機、計算機視覺、自動控制、機械工程等多個領域，研究包括室內環境的三維重建、動態障礙物的識別與規避、人體姿態的精細感知等核心技術。

而這個機器人實驗室的首要目標并非打造一款面向C端的消費級機器人，而是專注于感知能力的技術突破，

"vivo做機器人，核心還是圍繞感知能力。"胡柏山表示，手機積累的影像技術、AI算法、人機交互理解，都會成為機器人的基礎。但更重要的是，機器人會成為vivo感知生態的延伸，讓vivo在更多場景、更大范圍內建立感知優勢。

這種感知能力的生態外溢，最終將超出消費電子的邊界。

"感知能力的價值，在于它能為多少行業創造多少價值。"胡柏山說到，"這是vivo作為一家中國科技企業，應該承擔的產業責任。"

這種產業責任的承擔，需要長期投入和戰略定力作為支撐，而vivo的感知戰略，本質上就是一場關于"長期主義"的實踐。

這條路線的代價是沉重的。感知能力的構建需要五年、十年的持續投入，短期內難以看到顯著回報。當競爭對手靠"追熱點"收割流量和資本時，vivo必須承受戰略定力帶來的寂寞。當友商不斷發布"震撼業界"的新產品時，vivo只能埋頭做技術攻關。

但vivo選擇相信：時間會犒賞那些愿意下笨功夫的企業。在博鰲論壇上，胡柏山引用了老子《道德經》中的一句話："企者不立，跨者不行"，vivo的每一步，都走得扎實。

在行業普遍焦慮的時代，保持戰略定力本身就是一種稀缺能力。當AI時代真正進入深水區，vivo在感知能力上的長期積累，將成為它最堅實的壁壘。

這是vivo的押注，也是它的底牌。（雷峰網(公眾號：雷峰網)）

雷峰網原創文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

專題

全面突破 vivo NEX

本專題其他文章

馬廣宇

主筆

發私信

當月熱門文章

vivo胡柏山：在焦慮的AI時代，交一份最“冷靜”的答案

感知能力為什么是AI時代的競爭核心？

vivo的Agent Phone藍圖

用感知，成為IoT生態的“眼睛”

全面突破 vivo NEX

vivo胡柏山：在焦慮的AI時代，交一份最“冷靜”的答案

感知能力為什么是AI時代的競爭核心？