智能體到來，人人都能成為AI應用開發者嗎？

本文作者：二維馬曉寧

2024-04-18 07:04

導語：文心一言累計用戶規模達2億，日均調用量2億，飛槳文心生態已凝聚1295萬開發者。

初夏的深圳國際會展中心，在人影攢動的熱烈氛圍中迎來了一場百度AI的大閱兵，李彥宏以及多位百度重要業務負責人在Create 2024百度AI開發者大會上，向所有關注百度產品和AI技術的人秀出了最新實力。

去年三月份，百度文心一言發布；隨后十月份的百度世界大會上，王海峰解讀了文心大模型4.0的技術創新。一年來，文心大模型發展情況如何，是否有了新的突破，成為了人們關注的重點。

王海峰是這場閱兵儀式上最重要的人之一。現在人們渴望從這位百度AI的領航人口中，了解百度這家中國人工智能的領頭雁，進展到了什么階段。

如果這篇文章可以用一句話總結，那就是，在這場大會上，AI能力終于可以成為人手必備的能力了。

從思考到執行，智能體是什么？

自2023年3月16日文心一言發布以來，百度不斷迭代升級文心大模型，技術創新不斷，從知識增強、檢索增強，進一步發展出知識點增強；基于更大的算力、更多的數據和更強的算法，依托飛槳平臺，從文心3.0、3.5，到4.0，文心大模型能力愈加強大，效果和性能全面提升。

這些介紹未免過于泛泛而談，具體增強了哪些能力，以實際產品和應用效果來談更通俗易懂。

最顯著、也最讓人能體會到科幻感的一個變量，就是智能體。本來這就已經是一個熱門話題，這次大會，又讓人實實在在感受到了智能體的威力。

所謂智能體，就是能夠理解、規劃、反思和進化，讓機器像人一樣思考和行動，可以自主完成復雜任務，在環境中持續學習、實現自我迭代和進化。

從這個定義上來看，智能體的思考模式就已經和生物大腦同頻了。而百度還將這一過程白盒化，讓用戶能夠清楚看到，每一次輸入需求后，大模型是怎么理解的，又是如何經過思考調用工具來完成任務的。

王海峰也在會上展示了一個這樣一個案例。在文心大模型 4.0 工具版上輸入，“我要到大灣區出差一周，想了解一下天氣變化，請幫我查一下未來一周北京和深圳的溫度，告訴我出差應該在什么衣服并整理成表格。”

如果有一個人類助理收到了這樣的請求，思考路徑就會是，先查詢了解天氣情況和溫度，據此判斷合適的著裝應該是哪些，最后匯總成一個表格。

而案例中的智能體，也正是遵循了這樣一個思考過程。第一步是調用高級聯網工具來查詢天氣，第二步是調用代碼解釋器掛出溫度趨勢圖，第三步選擇合適的衣物，最后對結果進行思考確認，輸出表格。

對于人類來說，做出判斷很簡單，麻煩之處在于不停地查詢和記錄。但是對于大模型來說，最麻煩的地方，是如何讓大模型從一個步驟進行到另一個步驟。

從理解規劃，再到行為決策，最后調用多個工具完成任務，百度的智能體展示了非同一般的增強學習能力。

這正是文心大模型4.0工具版最令普通用戶感到驚喜的功能。一些簡單的決策工作，比如查詢航班找機票、安排日程做規劃之類的小事情，都能直接告訴文心一言，讓它給出一個決策意見。

簡單的幾句話，就能節省大量的人工操作，這就是智能體的意義。

模型自己寫代碼，程序員沒有門檻了嗎？

查詢天氣、航班等等，都可以統歸到信息處理一類，這些還是大模型的自然語言能力的延伸。我們在日常生活中需要的，遠遠不只是信息處理，有時候還需要智能體幫我們執行一些具體的工作。

比如查詢完行程和機票信息后，我們希望大模型能自動幫我們下單一張機票；做好個人財務規劃之后，我們希望大模型能自然幫我們購買符合我們自己需求的理財產品。

購買行為就是一次執行。那怎么讓大模型幫我們去做執行呢？

過去的人機互動模式，都是人類將需求轉化為指令，再將指令翻譯成計算機可以理解的“語言”，驅動計算機去做各種事情。做人與計算機之間的翻譯官，這就是程序員在這個時代的偉大意義。

編程是一門顯學，不過有能力寫代碼的程序員畢竟是少數人，對于不會寫代碼的人，王海峰帶領團隊進行的工作或許提供了一條新路徑，代碼智能體。

思考模型加上代碼解釋器，二者合一，構成了代碼智能體。

代碼智能體就是在完成思考完成后，把完成任務的指令和相關信息整合成提示，輸入給代碼解釋器，翻譯成可供執行的代碼，完成用戶更個性化的需求。代碼智能體的認知能力不容小覷。思考模型會對代碼解釋器的執行結果進行反思確認，如果正確，就把結果返回給用戶，不正確還能繼續進行自主迭代更新。

文心大模型經過萬億級的數據訓練，不僅包含了豐富的自然語言數據，還涵蓋了各種類型的代碼數據，所以可以將自然語言與代碼能力融會貫通，打通了從思考到執行的過程。

王海峰帶來了一個簡單的展示案例，如何為每一位前來參加百度Create大會的嘉賓定制邀請函。

對于一個成熟的設計師來說，這份工作非常簡單，重復性也比較高，做起來浪費時間，代碼智能體就能夠理解需求，識別邀請函模板內容后，自動生成代碼，將嘉賓姓名寫到合適的位置。

我們常常懷疑，大模型有了代碼能力，會不會取代程序員？但實際上，大模型能夠寫代碼，覆蓋的是那些簡單的工作，真正重要的研發，還是需要專業程序員的智慧。大模型能做的，是把他們從繁重的重復勞動中解放出來。

作為首席技術官，王海峰對于程序員工作中的煩惱也是感觸頗深。他提到，在實際工作中，很多程序員都有過接手代碼的經歷，需要從頭分析和理解整個工程代碼，非常耗時耗力，而文心大模型推出的智能代碼助手Comate就可以在其中提供幫助。

Comate這個詞，蘊含了百度工程師們對于智能代碼助手的期待——成為程序員的AI同儕。

Comate能夠接手所有低效耗時的繁瑣工作，只要一條簡單的指令，就可以快速了解整個代碼架構，包括模塊、功能、具體實現邏輯等等，進一步自動生成新代碼，比私人助理還要快捷方便。

文心大模型的代碼能力，既能夠降低普通人開發應用的門檻，也能夠降低程序員的工作量，從某種意義上來說，它提升了人機交互的效率。

大模型是最佳解決方案嗎？

這場“閱兵儀式”的最后一個重頭戲是多模型。

一個通用大模型雖然功能強大，但并不是解決所有問題的最佳答案。這次大會上百度發布了對大模型壓縮蒸餾后、再用數據訓練出來的三個輕量模型，ERNIE Speed、Lite、Tiny，針對不同的應用場景去做匹配。

做小模型的邏輯是，在大模型應用落地的過程中，效果、效率和成本都很重要，而在實際應用中，需要從場景需求出發，選擇最適合的模型。

王海峰現場分享了多模型技術。一方面，是高效低成本的模型生產；另一方面，是多模型推理。

高效低成本模型生產方面，百度研制了大小模型協同的訓練機制，可以有效進行知識繼承，高效生產高質量小模型，也可以利用小模型實現對比增強，幫助大模型的訓練。

同時，百度建設了種子模型矩陣，數據提質與增強機制，以及從預訓練、精調對齊、模型壓縮到推理部署的配套工具鏈。

高效低成本模型生產機制，助力應用速度更快、成本更低、效果更好。

多模型推理方面，百度研制了基于反饋學習的端到端多模型推理技術，構建了智能路由模型，進行端到端反饋學習，充分發揮不同模型處理不同任務的能力，達到效果、效率和成本的最佳平衡。

同等尺寸下，效果明顯更好，同等效果下，成本明顯更低。這就是多模型帶來的新變革。

結語

除了智能體、代碼和多模型技術，文心大模型在其他方面也持續創新，包括基于模型反饋閉環的數據體系、基于自反饋增強的大模型對齊技術，以及多模態技術等。王海峰現場公布，文心大模型4.0的效果持續提升，發布后的半年時間，又提升了52.5%。

文心大模型的持續快速進化，得益于百度在芯片、框架、模型和應用上的全棧布局，尤其是飛槳深度學習平臺和文心的聯合優化。文心大模型的周均訓練有效率達到98.8%，相比一年前文心一言發布時，訓練效率提升到當時的5.1倍，推理105倍。截至目前，飛槳文心生態已凝聚1295萬開發者，服務24.4萬家企事業單位，基于飛槳和文心創建89.5萬個模型。

人人都渴望AGI時代的到來，但是不知道AGI什么時候才能到來。說一句話，就讓機器人為我們做一系列工作，這不就是科幻世界中頻繁出現的場景嗎？

現在，文心一言累計用戶規模已達2億，日均調用量也達到了2億，高效滿足了用戶工作、生活和學習需求。

而這些成績可能很快就要被刷新，因為智能體的出現大大擴展了AI的場景、代碼助手又降低了開發者的門檻，多模型技術，為大量開發者、企業提升了效率，降低了成本。

王海峰談到了百度AI人才計劃的最新進展，百度在2020年提出了5年為全社會培養500萬AI人才，目前這一目標已提前達成。

有鑒于過去一年，百度為了彌合普通人與AI技術之間的認知、能力、應用鴻溝所做出的努力，可以預見到，未來將會有更多的AI人才，將會從大模型的研究和開發中揚帆起航。（雷峰網(公眾號：雷峰網)）

雷峰網原創文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

二維馬曉寧

編輯

發私信

當月熱門文章