0
| 本文作者: 貝爽 | 2021-09-26 16:55 |
悟道2.0,要怎么用起來?
連創“中國首個”和“世界最大”兩項記錄后,悟道大模型的落地應用成為業界關心的熱點話題。
GPT-3的問世掀起了一股“煉大模型”的浪潮,去年10月,北京智源研究院集結中國產學界100多位AI專家聯合攻關,在一年之內發布了1.75萬億級大規模預訓練模型悟道2.0,超越GPT-3、Switch Transformer,成為全球最大萬億級人工智能大模型。

時至今日,“產業應用”成為未來人工智能大模型時代的下一個賽點。
GPT-3早早開放了API供開發者使用。據OpenAI透露,截止今年3月,全球已有300多個APP采用了GPT-3技術,基于GPT-3的應用也有100多個;今年悟道2.0發布會上,智源研究院啟動大模型產業生態建設規劃,表示悟道大模型下一步將作為AI基礎設施,像“發電廠”一樣為不同行業、企業、個人開發者賦能。
9月24日,智源研究院承辦2021中關村論壇“人工智能與多學科協同創新”平行論壇,圍繞“人工智能大模型時代學科交叉和可持續發展”展開深入交流。會上,智源研究院學術副院長、清華大學教授唐杰公布了悟道2.0產業應用的最新進展,并發布了一系列技術創新成果。
唐杰教授表示,悟道大模型應用技術正在像“低門檻+高效率+高情商”三個方向努力,能夠滿足不同行業和企業實現規模化、產業化的應用需求,悟道正在從最大向“更好用”邁進。

此次技術創新包括:“悟道”大模型開發平臺、大模型高效推理工具包BMInf、全新升級的AI文圖繪畫大師CogView和實現大模型群聊的對話模型EVA。
大會現場還發布了“悟道2.0”賦能產業應用案例:冬奧會語音播報數字人和OPPP小布助手問答系統。小布助手是OPPO旗下開放式對話虛擬語音助手,OPPO小布技術總監楊振宇在現場表示,融合悟道大模型的生成式問答系統,解決了小布助手開放式對話的長尾問題,單條回答建設成本降低99%。
“悟道”開放平臺面向所有中小型企業、行業應用企業和IT領軍企業提供一站式服務,包括數據服務、在線訓練、模型調優、模型評測、在線部署,可通過API開放接口一鍵調用。

需求多樣化與場景碎片化是AI落地普遍存在的難點,智源研究院針對不同企業主體通過API既降低了應用門檻,也滿足了特定化需求。正常來講,百億級大模型訓練一次通常需要512張A100卡,約合人民幣六千萬。而對于數據不足、算力不足的中小企業,悟道開放平臺提供十億級別模型的在線訓練與微調。唐杰教授表示悟道開放平臺在快捷易用的同時,更注重解決規模化、產業化AI應用問題。目前平臺提供了寫詩、問答、繪畫等7種API功能。

解決可用問題之后,是如何幫助企業實現降本增效。悟道發布的開源大模型高效推理工具包BMInf,實現了“一卡頂四卡”,支持在低配置的NVIDIA GTX 1060單卡機上運行百億大模型。
智源研究團隊對原CPM2模型進行了基于INT8優化的微調,使得模型參數的存儲空間從40G壓縮到了10G,且性能基本保持不變。CPM2是為提高大模型精度和效率,研發的從模型、訓練、微調到推理的全鏈路高效訓練框架。此外,針對部分顯卡顯存不足的情況,工具包通過顯存和內存間的調度與優化,實現了低性能顯卡的大模型推理。
唐杰教授表示,原CPM2模型現已升級到CPM2.1,新模型通過持續學習,引入基于生成的預訓練任務,在保留補全能力的條件下大幅提升了文本生成能力。

繼今年6月份超越DALL·E取得MS COCO榜單第一后,CogView也進行了全新升級。CogView可以根據文本提示生成對應圖像,優化后其圖像生成能力實現了4倍提速,4倍清晰。CogView的繪畫能力可應用于服裝、海報等設計行業。
對話模型EVA是智源悟道團隊的最新研發成果,作為一款生成式對話系統,EVA模型主打高情商,能夠借鑒心理咨詢助人理論,實現深度情緒安撫,讓人機聊天更有溫度。除了心情聊天外,它還支持大模型在線群聊等多類趣味對話應用,有望推動“人與物”交流的現在時代邁進到“物與物”交流的人機共融未來時態。

基于以上能力,悟道大模型將在醫療、金融、新聞傳播等行業有著廣泛的應用空間。例如在金融、法律、零售等傳統行業領域,大模型能提供高性能的智能信息解析和提取、智能數據整合、自動機器翻譯、輔助決策等功能,提升業務流程效率和水平。在新聞傳播領域,基于模型可實現智能新聞線索收集、機器寫作、輔助編輯、虛擬主播等應用。
在大會現場,OPPO小布助手技術總監楊振宇發布了與智源研究院合作的首款應用——基于悟道大模型的“生成式問答系統”,大模型黑科技加持,小布助手在一定程度上解決行業共通的長尾問題。

AI語音技術在智能助手應用有著較為成熟的落地方案,智能家居、智能車載、新聞播報、智能終端等場景也有廣泛的應用案例。但現階段,“檢索式回答”是大多虛擬助手的主要人機交互方式之一,對話內容局限于模型自建庫和互聯網數據,這意味著,諸如長江長還是黃河長這類問題,如果無法在數據庫中找到答案,在度秘、搜狗助手、阿里夸克等途徑也無法查詢到的話,虛擬助手就無法做出回答。

從長尾問題來看,小布助手以及整個行業普遍存在的以下難題:
大量用戶提問(至少有1億),AI語音助手無法回答
長尾單個問題命中率低、體量大且無法窮盡
自建語料庫周期長,人工數據標注成本高
針對這些問題,悟道開放平臺提供了兩套解決方案:一是針對小布助手現有用戶已經提出的問題生成回答。“悟道”大模型具有強大的小樣本學習以及文本的理解與生成能力。
二是針對用戶未來可能問到的問題,通過“悟道”大模型結合知識圖譜,持續學習,形成持續知識預訓練模型,進而生成問答QA語料庫。目前每臺機器每天生成10萬左右的待審核答案,單條回答的建設成本降低了99%。

智源研究院學術副院長、清華大學教授唐杰與OPPO數智工程系統總裁劉海峰接受媒體采訪
在會后采訪中唐杰教授表示,他希望打造出更加智能的知識型、交互型、聊天式的智能助手,在回答人類提問時能夠更開放,風格更多樣化。當然,人性化的互動目標對模型的自然語言理解和生成提出了更高的要求,目前還沒有更好的解決方案,但悟道大模型正在朝著這個方向邁進。

另外,此次發布的基于悟道大模型的冬奧手語播報數字人,將在北京冬奧會期間正式投入應用,提供全流程智能化的數字人手語生成服務,方便聽障人士也能收看賽事專題報道。
從大煉模型,到煉大模型,智源研究院是其中強有力的推動者,從世界最大到產業落地,智源“悟道”一直堅持前沿引領。在他們看來,大模型的興起的背后,是邁向通用人工智能的一條極富潛力的路徑,也是推動傳統行業實現智能化改造和升級的新機遇。現階段,更智能的對話客服、更高效的機器翻譯、更智能的語音播報在電商、媒體、金融等領域已經表現出極大的發展空間,而“大算力+大數據+大參數”也驗證了模型越大,智能潛力越大。
黃鐵軍院長告訴AI科技評論,人工智能的潛力取決于數據,未來科學研究領域突破數據獲取的局限,大模型還有更廣闊的應用空間。悟道大模型就像「發電廠」,會形成類似于電網的智能基礎平臺,為全社會源源不斷地供應「智力源」。目前,以GPT-3、Switch Transformer為代表,布局大模型已成為世界性趨勢,國內百度、阿里達摩院、華為&循環智能等企業和科研機構也已相繼推出大模型ERNIE3、M6和盤古NLP。
雷鋒網雷鋒網雷鋒網
雷峰網特約稿件,未經授權禁止轉載。詳情見轉載須知。