0

初夏的深圳國際會展中心,在人影攢動的熱烈氛圍中迎來了一場百度AI的大閱兵,李彥宏以及多位百度重要業務負責人在Create 2024百度AI開發者大會上,向所有關注百度產品和AI技術的人秀出了最新實力。
去年三月份,百度文心一言發布;隨后十月份的百度世界大會上,王海峰解讀了文心大模型4.0的技術創新。一年來,文心大模型發展情況如何,是否有了新的突破,成為了人們關注的重點。
王海峰是這場閱兵儀式上最重要的人之一。現在人們渴望從這位百度AI的領航人口中,了解百度這家中國人工智能的領頭雁,進展到了什么階段。
如果這篇文章可以用一句話總結,那就是,在這場大會上,AI能力終于可以成為人手必備的能力了。
01
從思考到執行,智能體是什么?
自2023年3月16日文心一言發布以來,百度不斷迭代升級文心大模型,技術創新不斷,從知識增強、檢索增強,進一步發展出知識點增強;基于更大的算力、更多的數據和更強的算法,依托飛槳平臺,從文心3.0、3.5,到4.0,文心大模型能力愈加強大,效果和性能全面提升。
這些介紹未免過于泛泛而談,具體增強了哪些能力,以實際產品和應用效果來談更通俗易懂。
最顯著、也最讓人能體會到科幻感的一個變量,就是智能體。本來這就已經是一個熱門話題,這次大會,又讓人實實在在感受到了智能體的威力。
所謂智能體,就是能夠理解、規劃、反思和進化,讓機器像人一樣思考和行動,可以自主完成復雜任務,在環境中持續學習、實現自我迭代和進化。
從這個定義上來看,智能體的思考模式就已經和生物大腦同頻了。而百度還將這一過程白盒化,讓用戶能夠清楚看到,每一次輸入需求后,大模型是怎么理解的,又是如何經過思考調用工具來完成任務的。
王海峰也在會上展示了一個這樣一個案例。在文心大模型 4.0 工具版上輸入,“我要到大灣區出差一周,想了解一下天氣變化,請幫我查一下未來一周北京和深圳的溫度,告訴我出差應該在什么衣服并整理成表格。”
如果有一個人類助理收到了這樣的請求,思考路徑就會是,先查詢了解天氣情況和溫度,據此判斷合適的著裝應該是哪些,最后匯總成一個表格。
而案例中的智能體,也正是遵循了這樣一個思考過程。第一步是調用高級聯網工具來查詢天氣,第二步是調用代碼解釋器掛出溫度趨勢圖,第三步選擇合適的衣物,最后對結果進行思考確認,輸出表格。
對于人類來說,做出判斷很簡單,麻煩之處在于不停地查詢和記錄。但是對于大模型來說,最麻煩的地方,是如何讓大模型從一個步驟進行到另一個步驟。
從理解規劃,再到行為決策,最后調用多個工具完成任務,百度的智能體展示了非同一般的增強學習能力。
這正是文心大模型4.0工具版最令普通用戶感到驚喜的功能。一些簡單的決策工作,比如查詢航班找機票、安排日程做規劃之類的小事情,都能直接告訴文心一言,讓它給出一個決策意見。
簡單的幾句話,就能節省大量的人工操作,這就是智能體的意義。
02
模型自己寫代碼,程序員沒有門檻了嗎?
查詢天氣、航班等等,都可以統歸到信息處理一類,這些還是大模型的自然語言能力的延伸。我們在日常生活中需要的,遠遠不只是信息處理,有時候還需要智能體幫我們執行一些具體的工作。
比如查詢完行程和機票信息后,我們希望大模型能自動幫我們下單一張機票;做好個人財務規劃之后,我們希望大模型能自然幫我們購買符合我們自己需求的理財產品。
購買行為就是一次執行。那怎么讓大模型幫我們去做執行呢?
過去的人機互動模式,都是人類將需求轉化為指令,再將指令翻譯成計算機可以理解的“語言”,驅動計算機去做各種事情。做人與計算機之間的翻譯官,這就是程序員在這個時代的偉大意義。
編程是一門顯學,不過有能力寫代碼的程序員畢竟是少數人,對于不會寫代碼的人,王海峰帶領團隊進行的工作或許提供了一條新路徑,代碼智能體。
思考模型加上代碼解釋器,二者合一,構成了代碼智能體。
代碼智能體就是在完成思考完成后,把完成任務的指令和相關信息整合成提示,輸入給代碼解釋器,翻譯成可供執行的代碼,完成用戶更個性化的需求。代碼智能體的認知能力不容小覷。思考模型會對代碼解釋器的執行結果進行反思確認,如果正確,就把結果返回給用戶,不正確還能繼續進行自主迭代更新。
文心大模型經過萬億級的數據訓練,不僅包含了豐富的自然語言數據,還涵蓋了各種類型的代碼數據,所以可以將自然語言與代碼能力融會貫通,打通了從思考到執行的過程。
王海峰帶來了一個簡單的展示案例,如何為每一位前來參加百度Create大會的嘉賓定制邀請函。
對于一個成熟的設計師來說,這份工作非常簡單,重復性也比較高,做起來浪費時間,代碼智能體就能夠理解需求,識別邀請函模板內容后,自動生成代碼,將嘉賓姓名寫到合適的位置。
我們常常懷疑,大模型有了代碼能力,會不會取代程序員?但實際上,大模型能夠寫代碼,覆蓋的是那些簡單的工作,真正重要的研發,還是需要專業程序員的智慧。大模型能做的,是把他們從繁重的重復勞動中解放出來。
作為首席技術官,王海峰對于程序員工作中的煩惱也是感觸頗深。他提到,在實際工作中,很多程序員都有過接手代碼的經歷,需要從頭分析和理解整個工程代碼,非常耗時耗力,而文心大模型推出的智能代碼助手Comate就可以在其中提供幫助。
Comate這個詞,蘊含了百度工程師們對于智能代碼助手的期待——成為程序員的AI同儕。
Comate能夠接手所有低效耗時的繁瑣工作,只要一條簡單的指令,就可以快速了解整個代碼架構,包括模塊、功能、具體實現邏輯等等,進一步自動生成新代碼,比私人助理還要快捷方便。
文心大模型的代碼能力,既能夠降低普通人開發應用的門檻,也能夠降低程序員的工作量,從某種意義上來說,它提升了人機交互的效率。
03
大模型是最佳解決方案嗎?
這場“閱兵儀式”的最后一個重頭戲是多模型。
一個通用大模型雖然功能強大,但并不是解決所有問題的最佳答案。這次大會上百度發布了對大模型壓縮蒸餾后、再用數據訓練出來的三個輕量模型,ERNIE Speed、Lite、Tiny,針對不同的應用場景去做匹配。
做小模型的邏輯是,在大模型應用落地的過程中,效果、效率和成本都很重要,而在實際應用中,需要從場景需求出發,選擇最適合的模型。
王海峰現場分享了多模型技術。一方面,是高效低成本的模型生產;另一方面,是多模型推理。
高效低成本模型生產方面,百度研制了大小模型協同的訓練機制,可以有效進行知識繼承,高效生產高質量小模型,也可以利用小模型實現對比增強,幫助大模型的訓練。
同時,百度建設了種子模型矩陣,數據提質與增強機制,以及從預訓練、精調對齊、模型壓縮到推理部署的配套工具鏈。
高效低成本模型生產機制,助力應用速度更快、成本更低、效果更好。
多模型推理方面,百度研制了基于反饋學習的端到端多模型推理技術,構建了智能路由模型,進行端到端反饋學習,充分發揮不同模型處理不同任務的能力,達到效果、效率和成本的最佳平衡。
同等尺寸下,效果明顯更好,同等效果下,成本明顯更低。這就是多模型帶來的新變革。
04
結語
除了智能體、代碼和多模型技術,文心大模型在其他方面也持續創新,包括基于模型反饋閉環的數據體系、基于自反饋增強的大模型對齊技術,以及多模態技術等。王海峰現場公布,文心大模型4.0的效果持續提升,發布后的半年時間,又提升了52.5%。
文心大模型的持續快速進化,得益于百度在芯片、框架、模型和應用上的全棧布局,尤其是飛槳深度學習平臺和文心的聯合優化。文心大模型的周均訓練有效率達到98.8%,相比一年前文心一言發布時,訓練效率提升到當時的5.1倍,推理105倍。截至目前,飛槳文心生態已凝聚1295萬開發者,服務24.4萬家企事業單位,基于飛槳和文心創建89.5萬個模型。
人人都渴望AGI時代的到來,但是不知道AGI什么時候才能到來。說一句話,就讓機器人為我們做一系列工作,這不就是科幻世界中頻繁出現的場景嗎?
現在,文心一言累計用戶規模已達2億,日均調用量也達到了2億,高效滿足了用戶工作、生活和學習需求。
而這些成績可能很快就要被刷新,因為智能體的出現大大擴展了AI的場景、代碼助手又降低了開發者的門檻,多模型技術,為大量開發者、企業提升了效率,降低了成本。
王海峰談到了百度AI人才計劃的最新進展,百度在2020年提出了5年為全社會培養500萬AI人才,目前這一目標已提前達成。
有鑒于過去一年,百度為了彌合普通人與AI技術之間的認知、能力、應用鴻溝所做出的努力,可以預見到,未來將會有更多的AI人才,將會從大模型的研究和開發中揚帆起航。(雷峰網(公眾號:雷峰網))
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。