AI辦公的「最后一公里」有多遠？商湯跨過的3大關(guān)卡

本文作者：徐曉飛

2025-12-29 10:37

導(dǎo)語：什么是辦公Agent的「硬本領(lǐng)」與「真壁壘」？

眼下，AI辦公智能體正在迎來最熱切的期待與審視。

2024年“大模型吞噬軟件”論斷震驚全球科技圈，讓人們不得不正視：傳統(tǒng)軟件正在被以大模型為核心的新形態(tài)所顛覆。

而這一“新形態(tài)”最直接的體現(xiàn)便是以“自主決策、任務(wù)閉環(huán)”為核心的智能體。它推動了生產(chǎn)力工具從“功能堆砌”轉(zhuǎn)向“任務(wù)驅(qū)動”，把人從繁雜的軟件操作中解放出來，打通人與任務(wù)間的“最后一公里”。

這場革新中，辦公領(lǐng)域因數(shù)字化滲透最深、場景最廣、離生產(chǎn)力一線最近，成了變革的核心試驗場，也承載著人們的熱切與審視：智能體在辦公場景的“核心價值”是什么？何為“可用”與“好用”的智能體？從“可用”到“好用”的跨越，又需要哪些關(guān)鍵技術(shù)與經(jīng)驗支撐？

上周，商湯科技舉行了2025產(chǎn)品發(fā)布周。重新定義“AI原生辦公”——“辦公小浣熊3.0”為行業(yè)帶來了新范本。

什么是AI辦公的“核心訴求”？

事實上，傳統(tǒng)辦公模式長期受制于“軟件驅(qū)動” 的桎梏，因為其底層邏輯是： “人要去適配工具、遷就工具”。

比如，職場人需在多款軟件間頻繁切換，手動完成數(shù)據(jù)錄入、格式調(diào)整、信息同步等重復(fù)性工作，工作流被切割成一個個碎片化的操作環(huán)節(jié)。一個完整的任務(wù)往往要跨越多個平臺，不僅消耗大量時間成本，也容易因人為操作失誤而導(dǎo)致效率損耗。

這種模式下，工具成了“核心”，人反而成了被動的操作者，大量的創(chuàng)造力與決策價值都被繁瑣的流程稀釋掉了。這也是傳統(tǒng)辦公場景下長久存在的隱痛。

AI辦公智能體正在改變這種現(xiàn)狀。

但人們發(fā)現(xiàn)，不少產(chǎn)品距離用戶期待的“好用” 還有不小差距。有用戶曾向雷峰網(wǎng)反饋：“在一些國外技術(shù)論壇里，有不少乍一看讓人眼前一亮的 Aha moment 產(chǎn)品，但實際體驗下來卻效果一般。”

從“可用”到“好用”，至少要突破三大關(guān)卡

人們想要一款“好用”的AI辦公智能體，但“豐滿的理想”下，現(xiàn)實情況往往很復(fù)雜。

互聯(lián)網(wǎng)公司市場部經(jīng)理李萌對此感觸頗深。她們的市場團隊每天要對接五花八門的信息——既有銷售端傳來的Excel數(shù)據(jù)，又有活動策劃的Word方案，還有客戶投訴的聊天截圖，甚至是競品分析的PDF報告。

最頭疼的就是做營銷復(fù)盤時，得把Excel里的數(shù)據(jù)、微信里的客戶反饋、PPT里的活動亮點全湊到一起，光是整理素材就要耗大半天。

“之前用AI幫忙做復(fù)盤，文件一雜、信息一亂，它就抓不住重點，要么只羅列數(shù)據(jù)沒結(jié)論，要么漏了關(guān)鍵的客戶意見，根本達不到直接用的程度。”李萌無奈道。

在不少C端用戶眼里，以往的AI辦公產(chǎn)品同樣存在不夠好用的現(xiàn)象。

“過去的AI做PPT，總離直接落地差口氣——生成的往往只是文字堆砌的初稿，沒有清晰的邏輯框架，還缺少適配的圖表和配圖。”

比如要準備一份新產(chǎn)品宣講PPT，即便提供了產(chǎn)品數(shù)據(jù)、客戶需求、競品分析等信息，AI也只是簡單羅列內(nèi)容，既梳理不出層層遞進的邏輯，也不會自動將數(shù)據(jù)轉(zhuǎn)化為直觀圖表。

最終輸出的PPT，還需要用戶花大量時間調(diào)整結(jié)構(gòu)、優(yōu)化版式、補充素材，無法直接拿去使用，跨不過“最后一公里”的交付門檻。

類似的情況還有很多。

這時候，“好用”的AI辦公“搭子”到底應(yīng)該是什么樣的？

李萌在使用了小浣熊3.0這款辦公智能體后，有了自己的答案。

在月度增長復(fù)盤場景下，面對李萌團隊的困境，小浣熊能讀懂深層需求，自動拆解任務(wù)，整合 Excel 數(shù)據(jù)、分析報告等多源資料，直接輸出含數(shù)據(jù)圖表、結(jié)論明確的復(fù)盤報告和完整 PPT，李萌稍作確認即可直接使用，省去繁瑣打磨。

在PPT交付場景下，小浣熊構(gòu)建了一套多模態(tài)智能體創(chuàng)作引擎，把PPT制作從“幫著排版”直接拉到了“自己能做”的水平。

它能吃透用戶零散信息背后的真實需求，規(guī)劃好完整結(jié)構(gòu)，直接生成PPT——絕非簡單文字堆砌，而是已統(tǒng)籌好大綱、版式，還會自動匹配圖片、生成圖表，最終交付專業(yè)且可直接討論的成品。同時小浣熊3.0還具備類似人的 “記憶” 機制，能記住用戶的偏好和風格，讓后續(xù)的輸出更貼合用戶個人習慣。

而針對用戶經(jīng)常出差、路上使用電腦不便的場景，商湯小浣熊3.0還將在近期推出移動端APP，讓用戶在手機上也能延續(xù)電腦端的工作流程，變成一個永遠在線的口袋助理。

而這種從聽懂“指令”到理解“任務(wù)”，從給個“草稿”到交付“成果”，從困在“單點”到融入“全域”工作流，正是近期商湯小浣熊從2.0升級到3.0版本后實現(xiàn)的“三大能力躍遷”。

而這背后并非單純的技術(shù)迭代，也包含了對辦公本質(zhì)的深度思考。

商湯科技小浣熊負責人賈安亞告訴雷峰網(wǎng)，在研發(fā)之初，團隊就在思考：“什么是大模型時代的 AI 辦公？我們到底想做一個什么樣的 AI？”

“我們的答案非常明確：第一，我們不做冷冰冰的工具，而是要做能幫你進入“工作心流”的伙伴。第二，我們不做博眼球的demo，而是扎根用戶的真實場景，解決真問題。”

正是基于這一思考，過去兩年間，小浣熊從1.0到3.0一路走來，不斷升級。

什么才是AI辦公智能體的“真壁壘”？

雷峰網(wǎng)(公眾號：雷峰網(wǎng))對比發(fā)現(xiàn)，與市面上大部分AI辦公智能體相比，小浣熊3.0的優(yōu)勢體現(xiàn)在以下三點：

一是，超強的理解與數(shù)據(jù)分析能力。最早的小浣熊1.0版本——國內(nèi)首個數(shù)據(jù)分析智能體，其擅長的就是做復(fù)雜的多模態(tài)數(shù)據(jù)分析，并且得到了不錯的市場反饋。小浣熊3.0更支持了百萬級數(shù)據(jù)量處理，及多模態(tài)多源數(shù)據(jù)分析。

其二，100分的成果交付能力。小浣熊3.0依托商湯日日新Agentic RL（智能體強化學習）技術(shù)實現(xiàn)了端到端復(fù)雜任務(wù)規(guī)劃與閉環(huán)能力。尤其它建立更好的交互反饋與人機協(xié)作模式，讓所有過程、結(jié)果都可編輯，實現(xiàn)了可控輸出，讓95分的成果升級100分交付。

第三，移動端APP上線后，更補全了最后一塊跨平臺處理的拼圖。讓它能更好地實現(xiàn)全流程一站式辦公，融入企業(yè)工作流。

這其中，小浣熊 3.0 依托的商湯日日新Agentic RL是商湯科技在模型底層技術(shù)上的重要突破。

“我們?nèi)ツ甏蟛糠謺r間專注于數(shù)據(jù)分析，在單模態(tài)與多模態(tài)領(lǐng)域?qū)崿F(xiàn)突破；今年上半年則聚焦復(fù)雜任務(wù)，深耕推理、拆解能力及智能體技術(shù)，完成了重大突破。”賈安亞透露。

具體來說， Agentic RL解決了三大核心技術(shù)挑戰(zhàn)：

一是會“一步步琢磨”的長程推理。

面對圖片、文字、文檔這些雜亂的多類數(shù)據(jù)，"小浣熊"不再是簡單的模式匹配，而是擁有了像“思維鏈”一樣的自主規(guī)劃能力，能把一個模糊的分析目標（比如“做一份產(chǎn)品銷售分析”），拆成“整理數(shù)據(jù)→提煉關(guān)鍵信息→做圖表→驗證結(jié)論”等幾十個清晰步驟，還能一直記住前后邏輯，不跑偏。

二是，每一步都“自我檢查”的價值對齊。

不同于在多模態(tài)分析的每一步中，無論是提取PPT文件的頁面數(shù)據(jù)，還是編寫一段Python分析代碼，Agentic RL的Reward系統(tǒng)都會實時評估當前步驟動作的價值。

目前主流的強化學習僅對最終結(jié)果進行獎勵，而小浣熊引入了細粒度的過程監(jiān)督——不管是從PPT里提數(shù)據(jù)，還是寫一段分析代碼，每做完一步都會實時“打分”，判斷這步做得對不對、有沒有用。

這使得模型具備了一定的自我反思能力，對于中間步驟出現(xiàn)偏差，它能進行自我修正并重新規(guī)劃計劃，大幅降低了模型的幻覺率。

三是，環(huán)境交互與閉環(huán)進化。

簡單來說，小浣熊在處理任務(wù)時，會不斷和數(shù)據(jù)工具互動，根據(jù)反饋調(diào)整做事方法（比如這次圖表做反了，下次就自動修正）。這種機制讓模型能夠從錯誤中學習，實現(xiàn)推理能力的端到端的持續(xù)進化。

此外，針對PPT生成場景，小浣熊3.0專門研發(fā)了多模態(tài)智能體創(chuàng)作引擎，通過解耦內(nèi)容與樣式，實現(xiàn)高質(zhì)量、可直接交付的自主創(chuàng)作。

而小浣熊3.0能做到這些，背后還有著更深層次的壁壘支撐。

賈安亞告訴雷峰網(wǎng)，在AI辦公智能體的進化上，單點技術(shù)優(yōu)勢難以持久，小浣熊真正的核心優(yōu)勢，是技術(shù)層、產(chǎn)品層、落地方案執(zhí)行層聯(lián)動的組織化系統(tǒng)工程能力，而這背后是商湯十多年的沉淀。

比如，小浣熊兼具 B、C 兩端屬性，其中 To B 屬性方面，就依托了商湯在 To B 場景十年的深耕與積累，再加上小浣熊自身過去兩年間服務(wù) 300 多萬個人用戶與 1000 多家企業(yè)用戶的實踐，有教育版、金融版、政務(wù)版等等，沉淀出了一套成熟的To B、To C 系統(tǒng)工程方法論，這一點尤為關(guān)鍵。

因為眼下AI原生辦公已經(jīng)成為生產(chǎn)力基建，它不再是工具的簡單疊加，而是以用戶核心任務(wù)為軸心，徹底重構(gòu)流程、釋放生產(chǎn)力的效率革命。

這種背景下，從單一辦公工具升級為支撐企業(yè)數(shù)字化轉(zhuǎn)型的辦公平臺，尤其是支撐國產(chǎn)化辦公基礎(chǔ)設(shè)施，扛起服務(wù)者、基建者的使命，也成為中國AI企業(yè)的重要擔當。

以商湯為代表的企業(yè)正以行動踐行這一方向。

“為積極響應(yīng)國產(chǎn)化的需求，小浣熊已經(jīng)實現(xiàn)了從模型到硬件的全鏈路國產(chǎn)化適配，后續(xù)還會陸續(xù)推出國產(chǎn)化的AI PC、AI box，適配更多場景。”賈安亞補充道。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

徐曉飛

編輯

發(fā)私信

當月熱門文章