成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能 正文
    發私信給虞超
    發送

    0

    九章云極推出DART-GUI-7B模型,登頂 OSWorld 7B 榜首

    本文作者: 虞超   2026-01-28 12:19
    導語:2026 年 1 月,在操作智能領域權威評測體系 OSWorld 發布的最新榜單中,九章云極 DART-GUI-7B 模型,奪得 OSWorld 7B 賽道冠軍

    2026 年 1 月,在操作智能領域權威評測體系 OSWorld 發布的最新榜單中,九章云極 DataCanvas 憑借在 Alaya NeW Cloud 強化學習平臺上訓練的 DART-GUI-7B 模型,以卓越的智能操控表現,一舉奪得 OSWorld 7B 賽道冠軍!

    九章云極:Alaya NeW Cloud 強化學習平臺

    Alaya NeW Cloud 是由九章云極打造的以強化學習(Reinforcement Learning, RL)為核心能力的智算云平臺,該平臺通過將強化學習能力深度融入底層基礎設施,重構了智能計算的架構與邏輯,旨在為企業和開發者提供“可用、好用、經濟”的算力資源。

    Alaya NeW Cloud打造前沿強化學習云平臺,平臺原生支持一鍵式Agentic RL 開發環境啟動 、分布式極核Agentic RL訓練,性能上實現訓推分離與全流程加速,生態上預置多種主流Agent仿真環境,高效支撐強化學習技術的快速落地與創新突破,精準解決 AI 技術應用中的效率和成本等核心問題。目前,九章云極已在全球布局多個聚焦于加速計算優化的 AIDC 智算中心,持續賦能 AI 技術的高效應用與行業規模化落地。 九章云極推出DART-GUI-7B模型,登頂 OSWorld 7B 榜首

    DataCanvas Alaya NeW Cloud

    核心技術解讀:輕量化模型的GUI智能體突破

    什么是OSWorld?

    OSWorld 是目前 AI 領域衡量 “智能體(Agent)跨軟件操作電腦” 能力最頂尖的基準測試,它模擬真實的操作系統環境,要求 AI 像人類一樣通過視覺觀察屏幕,并精準操控瀏覽器、Excel、VS Code 等各類桌面應用來完成跨平臺的復雜任務,被OpenAI、Anthropic、字節跳動Seed、月之暗面、智譜等頂尖AI團隊廣泛采用,更是檢驗AI能否從“只會聊天”進化為“高效數字員工”的硬核試金石。

    為什么 OSWorld 對 7B 模型幾乎是“地獄難度”?

    ? 真實生態:任務在 VS Code、LibreOffice 等真實軟件中運行,環境信息密度遠超結構化數據

    ? 閉環操控:需要連續理解截圖、規劃路徑和進行鍵鼠操作,考驗長程推理能力

    ? 零容錯率:限時30步,操作需步步為營,失敗不可逆轉

    ? 數據稀疏:基礎成功率不足1/4,即使是大模型也面臨嚴峻挑戰

    復雜的跨軟件協作與精細的坐標控制,使得參數規模有限的7B模型在“理解”與“執行”之間難以調和,長期處于“不可用”狀態。

    核心技術路徑:九章云極 三大創新賦能輕量化突破

    1. 核心方法:解耦式 GUI 智能體強化學習框架

    九章云極并未通過簡單擴大模型規模取勝,而是選擇了系統級的算法創新。提出了 DART(Decoupled Agentic Reinforcement Training),首次將 GUI 智能體的強化學習訓練流程徹底解耦為四個異步模塊: 九章云極推出DART-GUI-7B模型,登頂 OSWorld 7B 榜首

    三項關鍵突破

    ? 推演級軌跡調度(Rollout-Level Scheduling)

    ? 以“單條軌跡”作為調度最小單位

    ? 每個 rollout 完成后立即釋放環境并啟動下一個任務

    ? 環境利用率提升從 12.2% 達到 67.7%,提升幅度高達 5.5 倍

    ? 動態模型服務池(Dynamic Model Serving Pool)

    ? 采用 GPU 推演的集中化管理,支持多模型版本的熱加載

    ? 避免了傳統“一卡一環境”的資源浪費

    ? GPU 推演利用率提升 1.6 倍

    ? GPU 資源的并發彈性擴展能力

    ? 訓練與推理異步執行(Asynchronous Execution of Training and Inference)

    ? 訓練與推演實現異步解耦

    ? 避免模型更新導致服務阻塞

    2. 數據策略:四層自適應篩選,放大稀疏成功信號

    針對 GUI 強化學習中的“成功少、噪聲多”核心難題,DART 設計了覆蓋任務、軌跡、步驟和 Token 的四層篩選機制:

    九章云極推出DART-GUI-7B模型,登頂 OSWorld 7B 榜首

    這一機制使得 7B 模型,在最大30步內,即可穩定的實現OSWorld中的任務要求。

    3. 多維優化:以輕量化參數對沖復雜場景,重塑性能邊界

    九章云極經過強化學習訓練的7B 模型之所以能實現突破,關鍵在于采用了“場景適配、精度優化、算力協同”的三維技術方案,在控制參數量的同時,最大化提升操作智能性能。

    ? 場景化指令對齊技術:基于百萬級真實操作場景數據訓練,構建細分領域的指令庫,優化模型對辦公自動化、數據處理等高頻場景的語義理解能力,精準捕捉模糊指令背后的核心需求,使指令理解準確率較通用模型提升23%,并減少無效操作。

    ? 混合精度推理優化:借鑒智算硬件優化經驗,對模型不同模塊進行精度分層處理。核心推理模塊保留 FP16 精度以確保準確性,非核心模塊量化至 INT8 精度。這一調度方式實現推理效率提升 1.8 倍,資源占用率降低 40%。

    ? 軟硬件協同調度機制:依托自研的智算技術棧優勢,深度協同模型推理與算力資源,動態調整算力分配策略以應對負載波動,避免資源閑置。同時使用專用推理加速引擎優化 GUI 元素識別與動作規劃的計算鏈路,進一步降低輕量化模型的推理延遲。

    實驗結果:全類型任務下性能優勢顯著 九章云極推出DART-GUI-7B模型,登頂 OSWorld 7B 榜首

    在最大步長僅有 30 步的情況下,DART-GUI-7B 在多種任務類型上表現出顯著優勢,包括:

    ? 瀏覽器類(Chrome)

    ? 圖像/設計類(GIMP)

    ? 郵件客戶端類(Thunderbird)

    ? 代碼/IDE 類(VS Code)

    ? 操作系統交互類(OS)

    亮點:GIMP 類任務的正確率高達 80.77%,且在辦公套件(Impress、Writer、Calc)、媒體播放類(VLC)以及多應用協同等任務中,其能力也有顯著提升。

    九章云極還進行了真實場景的驗證。在 DataCanvas Alaya NeW 平臺上,DART-GUI-7B 成功地通過鍵鼠操作完成文檔查找、導航到指定頁面及查找官網聯系方式等場景任務,其成功率超過 90%

    產業價值與未來展望

    目前,AI 大模型正加速從“技術驗證”向“產業落地”轉變。通用人工智能作為連接數字世界與物理操作的重要工具,在辦公自動化、智能運維和工業控制等領域展現出廣闊的應用前景。然而,模型部署成本高、輕量化模型性能不足及數據出域安全等問題,仍然是產業規模化的關鍵瓶頸。

    九章云極的 7B GUI 模型突破為行業提供了“低成本、高性能”的通用人工智能解決方案,有望推動通用人工智能在中小企業及長尾場景的普及。


    雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

    九章云極推出DART-GUI-7B模型,登頂 OSWorld 7B 榜首

    分享:
    相關文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說