0

眼下,AI辦公智能體正在迎來最熱切的期待與審視。
2024年“大模型吞噬軟件”論斷震驚全球科技圈,讓人們不得不正視:傳統(tǒng)軟件正在被以大模型為核心的新形態(tài)所顛覆。
而這一“新形態(tài)”最直接的體現(xiàn)便是以“自主決策、任務(wù)閉環(huán)”為核心的智能體。它推動了生產(chǎn)力工具從“功能堆砌”轉(zhuǎn)向“任務(wù)驅(qū)動”,把人從繁雜的軟件操作中解放出來,打通人與任務(wù)間的“最后一公里”。
這場革新中,辦公領(lǐng)域因數(shù)字化滲透最深、場景最廣、離生產(chǎn)力一線最近,成了變革的核心試驗場,也承載著人們的熱切與審視:智能體在辦公場景的“核心價值”是什么?何為“可用”與“好用”的智能體?從“可用”到“好用”的跨越,又需要哪些關(guān)鍵技術(shù)與經(jīng)驗支撐?
上周,商湯科技舉行了2025產(chǎn)品發(fā)布周。重新定義“AI原生辦公”——“辦公小浣熊3.0”為行業(yè)帶來了新范本。
事實上,傳統(tǒng)辦公模式長期受制于“軟件驅(qū)動” 的桎梏,因為其底層邏輯是: “人要去適配工具、遷就工具”。
比如,職場人需在多款軟件間頻繁切換,手動完成數(shù)據(jù)錄入、格式調(diào)整、信息同步等重復(fù)性工作,工作流被切割成一個個碎片化的操作環(huán)節(jié)。一個完整的任務(wù)往往要跨越多個平臺,不僅消耗大量時間成本,也容易因人為操作失誤而導(dǎo)致效率損耗。
這種模式下,工具成了“核心”,人反而成了被動的操作者,大量的創(chuàng)造力與決策價值都被繁瑣的流程稀釋掉了。這也是傳統(tǒng)辦公場景下長久存在的隱痛。
AI辦公智能體正在改變這種現(xiàn)狀。
但人們發(fā)現(xiàn),不少產(chǎn)品距離用戶期待的“好用” 還有不小差距。有用戶曾向雷峰網(wǎng)反饋:“在一些國外技術(shù)論壇里,有不少乍一看讓人眼前一亮的 Aha moment 產(chǎn)品,但實際體驗下來卻效果一般。”
人們想要一款“好用”的AI辦公智能體,但“豐滿的理想”下,現(xiàn)實情況往往很復(fù)雜。
互聯(lián)網(wǎng)公司市場部經(jīng)理李萌對此感觸頗深。她們的市場團隊每天要對接五花八門的信息——既有銷售端傳來的Excel數(shù)據(jù),又有活動策劃的Word方案,還有客戶投訴的聊天截圖,甚至是競品分析的PDF報告。
最頭疼的就是做營銷復(fù)盤時,得把Excel里的數(shù)據(jù)、微信里的客戶反饋、PPT里的活動亮點全湊到一起,光是整理素材就要耗大半天。
“之前用AI幫忙做復(fù)盤,文件一雜、信息一亂,它就抓不住重點,要么只羅列數(shù)據(jù)沒結(jié)論,要么漏了關(guān)鍵的客戶意見,根本達不到直接用的程度。”李萌無奈道。
在不少C端用戶眼里,以往的AI辦公產(chǎn)品同樣存在不夠好用的現(xiàn)象。
“過去的AI做PPT,總離直接落地差口氣——生成的往往只是文字堆砌的初稿,沒有清晰的邏輯框架,還缺少適配的圖表和配圖。”
比如要準備一份新產(chǎn)品宣講PPT,即便提供了產(chǎn)品數(shù)據(jù)、客戶需求、競品分析等信息,AI也只是簡單羅列內(nèi)容,既梳理不出層層遞進的邏輯,也不會自動將數(shù)據(jù)轉(zhuǎn)化為直觀圖表。
最終輸出的PPT,還需要用戶花大量時間調(diào)整結(jié)構(gòu)、優(yōu)化版式、補充素材,無法直接拿去使用,跨不過“最后一公里”的交付門檻。
類似的情況還有很多。
這時候,“好用”的AI辦公“搭子”到底應(yīng)該是什么樣的?
李萌在使用了小浣熊3.0這款辦公智能體后,有了自己的答案。
在月度增長復(fù)盤場景下,面對李萌團隊的困境,小浣熊能讀懂深層需求,自動拆解任務(wù),整合 Excel 數(shù)據(jù)、分析報告等多源資料,直接輸出含數(shù)據(jù)圖表、結(jié)論明確的復(fù)盤報告和完整 PPT,李萌稍作確認即可直接使用,省去繁瑣打磨。
在PPT交付場景下,小浣熊構(gòu)建了一套多模態(tài)智能體創(chuàng)作引擎,把PPT制作從“幫著排版”直接拉到了“自己能做”的水平。
它能吃透用戶零散信息背后的真實需求,規(guī)劃好完整結(jié)構(gòu),直接生成PPT——絕非簡單文字堆砌,而是已統(tǒng)籌好大綱、版式,還會自動匹配圖片、生成圖表,最終交付專業(yè)且可直接討論的成品。同時小浣熊3.0還具備類似人的 “記憶” 機制,能記住用戶的偏好和風格,讓后續(xù)的輸出更貼合用戶個人習慣。
而針對用戶經(jīng)常出差、路上使用電腦不便的場景,商湯小浣熊3.0還將在近期推出移動端APP,讓用戶在手機上也能延續(xù)電腦端的工作流程,變成一個永遠在線的口袋助理。
而這種從聽懂“指令”到理解“任務(wù)”,從給個“草稿”到交付“成果”,從困在“單點”到融入“全域”工作流,正是近期商湯小浣熊從2.0升級到3.0版本后實現(xiàn)的“三大能力躍遷”。
而這背后并非單純的技術(shù)迭代,也包含了對辦公本質(zhì)的深度思考。
商湯科技小浣熊負責人賈安亞告訴雷峰網(wǎng),在研發(fā)之初,團隊就在思考:“什么是大模型時代的 AI 辦公?我們到底想做一個什么樣的 AI?”
“我們的答案非常明確:第一,我們不做冷冰冰的工具,而是要做能幫你進入“工作心流”的伙伴。第二,我們不做博眼球的demo,而是扎根用戶的真實場景,解決真問題。”
正是基于這一思考,過去兩年間,小浣熊從1.0到3.0一路走來,不斷升級。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))對比發(fā)現(xiàn),與市面上大部分AI辦公智能體相比,小浣熊3.0的優(yōu)勢體現(xiàn)在以下三點:
一是,超強的理解與數(shù)據(jù)分析能力。最早的小浣熊1.0版本——國內(nèi)首個數(shù)據(jù)分析智能體,其擅長的就是做復(fù)雜的多模態(tài)數(shù)據(jù)分析,并且得到了不錯的市場反饋。小浣熊3.0更支持了百萬級數(shù)據(jù)量處理,及多模態(tài)多源數(shù)據(jù)分析。
其二,100分的成果交付能力。小浣熊3.0依托商湯日日新Agentic RL(智能體強化學習)技術(shù)實現(xiàn)了端到端復(fù)雜任務(wù)規(guī)劃與閉環(huán)能力。尤其它建立更好的交互反饋與人機協(xié)作模式,讓所有過程、結(jié)果都可編輯,實現(xiàn)了可控輸出,讓95分的成果升級100分交付。
第三,移動端APP上線后,更補全了最后一塊跨平臺處理的拼圖。讓它能更好地實現(xiàn)全流程一站式辦公,融入企業(yè)工作流。
這其中,小浣熊 3.0 依托的商湯日日新Agentic RL是商湯科技在模型底層技術(shù)上的重要突破。
“我們?nèi)ツ甏蟛糠謺r間專注于數(shù)據(jù)分析,在單模態(tài)與多模態(tài)領(lǐng)域?qū)崿F(xiàn)突破;今年上半年則聚焦復(fù)雜任務(wù),深耕推理、拆解能力及智能體技術(shù),完成了重大突破。”賈安亞透露。
具體來說, Agentic RL解決了三大核心技術(shù)挑戰(zhàn):
一是會“一步步琢磨”的長程推理。
面對圖片、文字、文檔這些雜亂的多類數(shù)據(jù),"小浣熊"不再是簡單的模式匹配,而是擁有了像“思維鏈”一樣的自主規(guī)劃能力,能把一個模糊的分析目標(比如“做一份產(chǎn)品銷售分析”),拆成“整理數(shù)據(jù)→提煉關(guān)鍵信息→做圖表→驗證結(jié)論”等幾十個清晰步驟,還能一直記住前后邏輯,不跑偏。
二是,每一步都“自我檢查”的價值對齊。
不同于在多模態(tài)分析的每一步中,無論是提取PPT文件的頁面數(shù)據(jù),還是編寫一段Python分析代碼,Agentic RL的Reward系統(tǒng)都會實時評估當前步驟動作的價值。
目前主流的強化學習僅對最終結(jié)果進行獎勵,而小浣熊引入了細粒度的過程監(jiān)督——不管是從PPT里提數(shù)據(jù),還是寫一段分析代碼,每做完一步都會實時“打分”,判斷這步做得對不對、有沒有用。
這使得模型具備了一定的自我反思能力,對于中間步驟出現(xiàn)偏差,它能進行自我修正并重新規(guī)劃計劃,大幅降低了模型的幻覺率。
三是,環(huán)境交互與閉環(huán)進化。
簡單來說,小浣熊在處理任務(wù)時,會不斷和數(shù)據(jù)工具互動,根據(jù)反饋調(diào)整做事方法(比如這次圖表做反了,下次就自動修正)。這種機制讓模型能夠從錯誤中學習,實現(xiàn)推理能力的端到端的持續(xù)進化。
此外,針對PPT生成場景,小浣熊3.0專門研發(fā)了多模態(tài)智能體創(chuàng)作引擎,通過解耦內(nèi)容與樣式,實現(xiàn)高質(zhì)量、可直接交付的自主創(chuàng)作。
而小浣熊3.0能做到這些,背后還有著更深層次的壁壘支撐。
賈安亞告訴雷峰網(wǎng),在AI辦公智能體的進化上,單點技術(shù)優(yōu)勢難以持久,小浣熊真正的核心優(yōu)勢,是技術(shù)層、產(chǎn)品層、落地方案執(zhí)行層聯(lián)動的組織化系統(tǒng)工程能力,而這背后是商湯十多年的沉淀。
比如,小浣熊兼具 B、C 兩端屬性,其中 To B 屬性方面,就依托了商湯在 To B 場景十年的深耕與積累,再加上小浣熊自身過去兩年間服務(wù) 300 多萬個人用戶與 1000 多家企業(yè)用戶的實踐,有教育版、金融版、政務(wù)版等等,沉淀出了一套成熟的To B、To C 系統(tǒng)工程方法論,這一點尤為關(guān)鍵。
因為眼下AI原生辦公已經(jīng)成為生產(chǎn)力基建,它不再是工具的簡單疊加,而是以用戶核心任務(wù)為軸心,徹底重構(gòu)流程、釋放生產(chǎn)力的效率革命。
這種背景下,從單一辦公工具升級為支撐企業(yè)數(shù)字化轉(zhuǎn)型的辦公平臺,尤其是支撐國產(chǎn)化辦公基礎(chǔ)設(shè)施,扛起服務(wù)者、基建者的使命,也成為中國AI企業(yè)的重要擔當。
以商湯為代表的企業(yè)正以行動踐行這一方向。
“為積極響應(yīng)國產(chǎn)化的需求,小浣熊已經(jīng)實現(xiàn)了從模型到硬件的全鏈路國產(chǎn)化適配,后續(xù)還會陸續(xù)推出國產(chǎn)化的AI PC、AI box,適配更多場景。”賈安亞補充道。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。