0
從2023年開始,三年時間,中國科技產業開啟了所謂的"大模型狂飆時代"。
自ChatGPT引爆全球AI熱潮以來,中國科技行業迅速陷入了一場前所未有的集體焦慮。從互聯網巨頭到傳統制造業,從手機廠商到汽車新勢力,都試圖與"大模型"或"生成式AI"概念建立關聯,參數規模從千億躍升至萬億,戰略合作的簽署儀式頻繁見報。
DeepSeek的爆火恰好再次印證了這一觀點,在行業落地方向尚未明確時,各行各業均選擇了“先上車后補票”的方式乘上這趟“快車”。
不可否認的是,AI是現今科技產業最重要的發展方向之一,但在這場集體性的非理性繁榮中,冷靜思考變成了一件奢侈的事,畢竟沒有人愿意被貼上"錯過AI時代"的標簽,哪怕這種焦慮的來源本身就是對技術變革的過度反應。
今年春節開始,OpenClaw又掀起了一陣AI熱潮,只是在短暫的繁榮后,熱度又開始悄然退下。這是每一個新技術的終局,同樣也是對技術浮躁、焦慮的代價。如何讓AI理解世界、理解用戶、理解任務,這些基礎問題仍沒有人做出回答。
這是一個需要長期投入、難以短期變現、無法靠發布會解決的問題。正因如此,大多數企業選擇回避,轉而將資源投入到更具傳播效應的"追熱點"策略中。
vivo是少數選擇正面回答這個問題的企業。
2026年3月,博鰲亞洲論壇。vivo總裁、首席運營官胡柏山在演講中明確表示:"我們把核心資源聚焦在端側AI和產業鏈協同,思考用戶在AI時代真正需要什么樣的體驗。"
這番表述可以視為一家成熟企業對技術趨勢的理性判斷。
如果我們仔細審視vivo過去五年的技術布局和戰略選擇,會發現這家企業正在下一盤遠比"發布大模型"更為深遠的大棋:感知能力賽道。
感知能力,是vivo對"AI時代競爭核心"這個問題的回答。
"在未來AI時代,算力、模型能力不具備差異化"。胡柏山的判斷,也是vivo感知戰略的決策基礎。
在vivo看來,隨著芯片工藝持續進步和模型架構不斷優化,算力和模型能力將會供應鏈化,每個手機廠商都有更多選擇權,不再構成競爭壁壘,而這一點也正在被行業驗證。
2024年至2026年間,聯發科、高通、蘋果、三星等主流芯片廠商的旗艦SoC在AI算力上持續快速提升。與此同時,高通驍龍系列、蘋果A系列的自研神經網絡引擎也在同步演進。這意味著,端側AI的算力基礎正在快速走向同質化。
在模型層面,開源社區的貢獻同樣不可忽視。Meta的Llama系列、Google的Gemma系列、阿里云的Qwen系列等開源大模型,已經能夠提供接近閉源模型的性能表現,且授權費用極低。對于手機廠商而言,基于開源模型進行微調,正在成為一條可行的技術路徑。
一個邏輯是,當算力和模型都不再是稀缺資源,企業就必須尋找新的差異化方向。vivo給出的答案是:以影像為基礎,構建AI落地物理世界的視覺感知中樞。
今年開始,vivo內部就已經對感知賽道進行立項,核心是把視覺、聽覺、觸覺等感知,通過傳感器加以感知大模型,轉化成AI想要得到的物理世界的信息。
所謂"數字世界連接物理世界",指的便是AI理解、分析、處理物理世界信息的能力。一張圖片中的光影關系、一段視頻里的空間結構、用戶臉上的情緒變化。這些物理世界的感知信息,需要被AI"翻譯"成可理解、可分析、可決策的數字信號。
胡柏山的看法是:真正的差異化,在于誰數字世界連接物理世界的能力越強,誰就越'聰明'。而這恰巧是vivo的強項所在,過去十年,vivo在影像上做了巨大投入,除了讓照片變得更好看,同樣也是在建立一套完整的物理世界感知系統。
這套感知系統的技術架構,包含三層架構:
第一層是光學系統——鏡頭光學設計、鍍膜工藝、光學防抖等技術,決定了"看得到"的邊界。vivo與蔡司的深度合作,正是這一層的戰略投資,雙方持續在光學設計、鍍膜工藝、色彩科學等領域深化合作。
第二層是成像處理——ISP算法、HDR融合、多幀降噪、色彩科學等技術,決定了"看得清"的能力。vivo自研的V3影像芯片,專門針對這一層進行了算力優化。V3采用了先進的6nm制程工藝,AI算力相比前代提升40%,能夠支持4K級別的實時畫面增強。
第三層是感知理解——場景識別、語義分割、空間建模、情緒感知等AI能力,決定了"看得懂"的深度。這是vivo感知戰略的核心差異化所在。在這一層,vivo的藍心大模型矩陣發揮著關鍵作用。藍心大模型是vivo自主研發的多模態AI模型系列,能夠對圖像和視頻內容進行深度理解,識別物體、場景、關系、情緒等多維信息。
三層能力的疊加,使vivo的手機成為一臺真正意義上的"物理世界感知終端"。當用戶舉起手機拍照時,不僅在記錄一個瞬間,更是在讓AI"觀察"和"理解"當前的物理場景。
這種感知能力的長期價值,遠超一款手機的功能升級。vivo認為,當未來AI真正深入到千行百業時,具備強大感知能力的終端將成為最重要的數據入口,這也意味著感知能力賽道的競爭,已經悄然開始。(雷峰網)
在博鰲亞洲論壇,胡柏山指出——Smart Phone 將進化成Agent Phone。
什么是Agent Phone?用vivo的理解,這是一種能夠主動理解用戶需求、自動完成任務、智能調度服務的下一代智能手機。
這與"智能手機"有著本質區別。智能手機的核心是"工具":人使用手機來處理任務、獲取信息,手機始終處于"被動響應"的狀態。但Agent Phone的核心是"伙伴":手機主動感知環境、理解需求、預判行動,成為真正懂你的智能代理。
這個轉變的關鍵驅動力,依然是感知能力。
當前智能手機的交互邏輯,本質上是"輸入-反饋"模式:用戶發出指令,手機執行并返回結果。整條交互鏈路是離散的、事件驅動的。但Agent Phone的交互邏輯將是"感知-理解-行動":手機持續感知環境和用戶狀態,在后臺構建對當前場景的深度理解,然后主動提供最合適的響應和服務。
vivo對于Agent Phone有著超前的理解,但距離落地仍有許多現實問題需要解決。
首先是意圖理解,手機需要從用戶的模糊表述甚至無表述行為中,準確推斷用戶的真實意圖。這要求端側AI具備強大的上下文理解能力和長程記憶能力,能夠綜合用戶的歷史行為、當前位置、時間狀態、日程安排等多維信息進行綜合判斷。
其次是任務規劃能力,當確認用戶意圖后,手機需要自動拆解任務步驟、調用相關App和數據、在后臺完成復雜操作流程,并在必要時向用戶確認關鍵決策。這需要手機具備跨App、跨服務的任務編排能力。
最后是隱私邊界問題,在 vivo 看來這是不可逾越的底座。主動服務意味著手機需要持續感知和分析用戶狀態,Agent Phone需要在隱私保護和服務能力之間找到平衡點,做到既能提供足夠智能的服務,又要確保用戶對數據的控制權。
vivo的解法是將感知和推理過程盡可能保留在端側。胡柏山透露,vivo正在與芯片廠商、算法公司、學術機構深度合作,共同定義面向端側AI的新一代算力架構。"單靠手機廠商自己做不了端側AI,必須拉著產業鏈一起做。"
與Arm 建立聯合實驗室,與聯發科從底層硬件到軟件的多層面聯合研發,包括性能、AI、影像、游戲、通訊還有多媒體等各個領域;而在學術層面,vivo與清華大學、北京大學、上海交通大學等高校建立了深度合作關系,在端側AI的基礎研究上持續投入。
Agent Phone的底層支撐,是端側AI的意圖理解能力和感知系統對環境的實時建模。兩者的結合,使手機能夠在本地完成對用戶需求的理解、規劃和執行,既保證了響應速度,又保護了用戶隱私。
vivo在博鰲論壇上宣布,搭載相機Agent能力的新一代旗艦機型X300 Ultra 與X300s即將發布。除了專業的影像能力進一步提升,從某種程度來說,這也是Agent Phone的階段性成果展示。
但胡柏山明確表示,Agent Phone只是起點,不是終點。
"X300 Ultra會展示Agent Phone的核心能力,但它還不是終極形態。"他在專訪中透露,"真正的Agent Phone需要感知能力、端側AI、IoT生態的完整配合,這需要一個更長的建設周期。"
在vivo的戰略藍圖里,感知能力的價值遠不止于手機。
在vivo的生態藍圖里,手機不是終點,而是起點。用胡柏山的話:"以影像+AI構建的視覺感知中樞,可以升級為IoT生態的視覺感知中樞。"
在vivo看來,IoT行業有著難以解決的問題,單個智能化設備的感知過于片面,最終導致這些設備都缺乏一個共同的"感知中樞"來整合多維信息、構建統一理解。vivo認為,手機可以承擔這個角色。
當手機具備強大的視覺感知能力,它可以成為IoT生態的"眼睛"——通過與各類IoT設備的互聯互通,匯聚來自不同維度、不同位置、不同視角的感知信息,形成對用戶生活場景的完整理解。
"你的手機看到你在客廳,它就知道你的電視、音箱、空調應該怎么調整。"胡柏山舉例道,"但這只是第一步。未來,手機的感知能力會延伸到更多品類,讓更多設備'看見'這個世界。"
這種"感知延伸"的戰略,需要新的產品形態作為載體。
去年,vivo成立了機器人Lab,其成員來自無人機、計算機視覺、自動控制、機械工程等多個領域,研究包括室內環境的三維重建、動態障礙物的識別與規避、人體姿態的精細感知等核心技術。
而這個機器人實驗室的首要目標并非打造一款面向C端的消費級機器人,而是專注于感知能力的技術突破,
"vivo做機器人,核心還是圍繞感知能力。"胡柏山表示,手機積累的影像技術、AI算法、人機交互理解,都會成為機器人的基礎。但更重要的是,機器人會成為vivo感知生態的延伸,讓vivo在更多場景、更大范圍內建立感知優勢。
這種感知能力的生態外溢,最終將超出消費電子的邊界。
"感知能力的價值,在于它能為多少行業創造多少價值。"胡柏山說到,"這是vivo作為一家中國科技企業,應該承擔的產業責任。"
這種產業責任的承擔,需要長期投入和戰略定力作為支撐,而vivo的感知戰略,本質上就是一場關于"長期主義"的實踐。
這條路線的代價是沉重的。感知能力的構建需要五年、十年的持續投入,短期內難以看到顯著回報。當競爭對手靠"追熱點"收割流量和資本時,vivo必須承受戰略定力帶來的寂寞。當友商不斷發布"震撼業界"的新產品時,vivo只能埋頭做技術攻關。
但vivo選擇相信:時間會犒賞那些愿意下笨功夫的企業。在博鰲論壇上,胡柏山引用了老子《道德經》中的一句話:"企者不立,跨者不行",vivo的每一步,都走得扎實。
在行業普遍焦慮的時代,保持戰略定力本身就是一種稀缺能力。當AI時代真正進入深水區,vivo在感知能力上的長期積累,將成為它最堅實的壁壘。
這是vivo的押注,也是它的底牌。(雷峰網(公眾號:雷峰網))
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。