成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    芯片 正文
    發私信給楊依婷
    發送

    0

    昇思MindSpore實現超節點的「類單機開發體驗」的三項關鍵能力

    本文作者: 楊依婷   2025-12-30 10:04
    導語:“把超節點當作一臺超級計算機來編程和調度。”

    當大模型進入十萬億參數、長序列、稀疏化和非規則結構并行發展的階段,AI算力基礎設施正在發生一次根本性變化:從傳統服務器集群,演進為以高速互聯為核心的超節點架構

    2025年12月25日,昇思人工智能框架峰會在杭州召開。大會以“昇思MindSpore為超節點而生的AI框架”為主題,來自產業界、學術界和開源社區的多位嘉賓,從不同角度給出了一個共同判斷:AI基礎設施已經進入超節點時代,而AI框架正站在范式切換的臨界點上。

    超節點不再只是多臺服務器的簡單堆疊,而是通過高速互聯,在邏輯層面“像一臺機器一樣學習、思考和推理”,具備資源池化、對等架構與網絡拓撲分層多樣的特征。

    昇思MindSpore開源社區技術委員會主席金雪鋒在演講中指出,大模型的演進正在同時帶來三重挑戰:

    •  一是模型規模持續增長,片上內存壓力急劇上升;

    •  二是模型結構從單一語言模型走向全模態,子模型組合更加復雜、不規則;

    •  三是訓推范式趨于異構,訓練、推理與Agent運行需要協同編排。

    金雪鋒說,正是這些變化,推動AI基礎設施從“服務器集群時代”邁入“超節點時代”,AI框架將迎來新的架構范式。

    昇思MindSpore給出的答案是,把超節點當作一臺“超級計算機”,在框架層面統一編程和調度,而不是讓開發者直接面對復雜的集群拓撲和并行細節。

    這一判斷,也成為昇思MindSpore提出“為超節點而生”的核心邏輯起點。

    HyperParallel架構:把復雜并行留給框架

    “很多人聽過超節點,但并不真正理解超節點。”

    在峰會之后的媒體溝通會上,現任昇思MindSpore開源社區理事長王紫東強調這一點。

    在他的解釋中,超節點并不是簡單地把更多NPU卡堆在一起,而是通過超高帶寬互聯,讓大量計算單元在邏輯層面形成一個高度耦合的整體。卡與卡之間不再是“慢速通信的鄰居”,而是隨時可調度的數據通路。

    這一變化,直接服務于一個現實需求:模型太大了,大到必須極致并行。

    當模型被切分到數百、數千張卡上時,真正的瓶頸已經不再是算力本身,而是:

    ? 數據什么時候該在哪一張卡上

    ? 狀態何時遷移

    ? 通信與計算如何重疊

    ? 并行策略如何隨模型結構變化而調整

    “硬件的性能上限提高了,但如果軟件跟不上,性能是用不出來的。”王紫東直言,超節點越強,對AI框架的要求反而越高。

    昇思MindSpore提出了一個清晰而激進的定位——
    把復雜留給自己,把簡單留給開發者。

    在傳統集群時代,開發者往往需要手動理解并行策略、通信模式和硬件拓撲,而在超節點時代,這種模式已經不可持續。集群拓撲越來越復雜,節點規模越來越大,如果復雜性繼續外溢到開發層,開發效率和穩定性將迅速崩塌。

    MindSpore的選擇,是讓AI框架本身承擔更多系統級責任,其目標,是讓開發者在超節點復雜算力環境中仍能保持“類單機”的開發體驗,而HyperParallel架構正是實現這一目標的關鍵。

    金雪鋒在峰會上系統拆解了HyperParallel的三項關鍵能力。

    首先是 HyperOffload。

    隨著模型規模持續擴大,片上內存容量成為制約訓練和推理的重要瓶頸。HyperOffload通過實現計算與狀態分離,利用超節點的池化存儲能力,將模型狀態卸載到遠端內存中,從而釋放片上資源。在實際應用中,MindSpore給出的數據是:訓練性能提升20%以上,推理支持的序列長度提升70%以上,這不是簡單的“搬數據”,而是對計算時序的精確調度。

    其次是 HyperMPMD

    SPMD曾經是AI并行的黃金標準,但在多模態、強化學習、Agent 等場景下,它開始顯得僵硬。HyperMPMD推動并行從 “所有節點做同一件事”,走向 “不同節點做不同任務”,這種 MPMD 模式,充分利用了超節點對等互聯的優勢,讓通算并發成為常態,在相關場景中,算力利用率可提升 15% 以上。

    第三是 HyperShard

    在傳統命令式并行編程中,算法、并行策略與集群架構高度耦合,新模型一旦出現,往往需要對并行方案進行大規模重構。HyperShard引入聲明式并行編程方式,將算法與并行策略解耦,同時屏蔽底層超節點網絡拓撲的復雜性。金雪鋒表示,在這一模式下,新算法的并行化改造時間可以壓縮到1天以內,并行策略調優從“天級”縮短至“小時級”。

    從HyperOffload到HyperMPMD,再到HyperShard,昇思MindSpore的目標并非單點性能提升,而是讓超節點的復雜性由框架消化,而不是由開發者承擔。

    五年開源積累:超節點能力為何離不開社區

    MindSpore為什么“突然變好用了”?

    現任昇思MindSpore開源社區理事長王紫東并沒有從性能參數或功能列表切入,而是給出了一個并不“市場化”的判斷標準——社區Issue的自閉環率。

    在他看來,一個健康的AI框架社區,并不是依賴官方不斷“救火”,而是開發者之間能夠圍繞問題展開討論,自主定位原因、提交修復,并通過PR形成持續正反饋。“問題能不能在社區內部被解決,往往比解決得有多快更重要。”王紫東說。

    也正是在這一意義上,他將MindSpore五年來最重要的成果,歸結為兩個字:社區。

    華為于2020年3月28日正式開源昇思MindSpore。五年來,這一社區逐步形成規模效應:覆蓋全球156個國家和地區,累計下載量超過1300萬次,代碼合入量超過12萬次,核心貢獻開發者超過5.2萬人,并聯合2000多家社區伙伴,孵化出3100多個行業應用。

    這些數字本身并不新鮮,但它們背后所指向的,是一條已經被反復驗證的路徑——自主AI框架并非封閉體系,而可以通過開放協作,形成持續演進的技術能力。

    時任昇思MindSpore開源社區理事長丁誠在峰會上表示,昇思始終堅持開放治理,踐行“共建、共治、共享”的社區理念。一方面持續推進框架技術演進,另一方面也通過課程、競賽和工程實踐,支持AI人才從入門到深度參與開源生態,逐步成長為產業中的中堅力量。

    當這種社區能力與超節點架構結合時,其價值開始在真實工程場景中顯現。

    中國工程院院士、中國商飛首席科學家吳光輝在演講中介紹,中國商飛上海飛機設計研究院基于昇思MindSpore框架,推出了民機超臨界翼型氣動設計智能體“御風·智翼”,構建了基于工程經驗的超臨界翼型智能一站式解決方案。

    吳光輝指出,大飛機是“工業皇冠上的明珠”,而飛機氣動設計直接決定民用飛機的關鍵性能,通過將AI框架與工程經驗深度結合,相關設計研發正在向更加智能化、一體化的方向演進。這一實踐,也成為昇思MindSpore在復雜工程領域落地的一個縮影。

    從服務器集群到超節點,從單一模型訓練到多任務并行運行,AI 算力形態正在發生根本性變化。在這條變化曲線上,AI框架的角色也隨之轉變——它不再只是“讓模型跑起來”的工具,而正在演變為連接算力、模型與應用的組織者。

    昇思MindSpore給出的選擇,是將超節點帶來的復雜性盡可能收斂到框架內部,讓開發者不必直接面對集群拓撲與并行細節,也不必在模型結構變化時反復推倒重來。

    這種選擇并不輕松。它意味著更重的系統工程投入、更長周期的技術積累,也意味著必須依托一個真實活躍的開源社區,在實踐中不斷校正方向。

    但在超節點逐漸成為主流算力形態、Agent 與多任務運行走向常態的背景下,AI 框架是否具備“消化復雜性”的能力,正在成為新的分水嶺。

    或許正是在這個意義上,昇思 MindSpore 圍繞超節點與開源展開的探索,并不是一次孤立的技術發布,而是一種關于AI框架如何參與下一輪算力演進的現實回答。

    雷峰網(雷峰網(公眾號:雷峰網)

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    分享:
    相關文章

    編輯

    歡迎添加作者微信EATINGNTAE進行交流~
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說