成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    芯片 正文
    發私信給劉伊倫
    發送

    0

    云天勵飛發布未來三年算力芯片戰略:聚焦推理效能升級,全線對標英偉達新一代產品

    本文作者: 劉伊倫   2026-02-05 10:27
    導語:云天勵飛是國內屈指可數手握充足國產產能保障的企業之一。

    雷峰網(公眾號:雷峰網)消息,2月3日,云天勵飛首次對外公布未來三年的大算力AI推理芯片戰略布局,將實現百萬Tokens推理成本降低100倍以上的目標。

    推理算力需求暴漲,是在行業中實際發生的結構性變革。

    德勤發布的報告指出2026年推理算力將占整體AI算力的66%,推理優化芯片市場在2026年將增長至超500億美元。字節旗下豆包大模型Token使用量從2024年的單日0.12萬億,到2025年12月已突破50萬億。

    多個行業信號共同指向一個趨勢:推理側競爭已不再單純是“把模型做得更強”的參數競賽,而是“讓應用跑得更久、更穩、更便宜”的效能競賽,單位推理成本與交付效率已成為規模化落地的最大門檻。

    “在推理芯片領域,依托國內豐富的應用場景、穩定可靠的電網和快速迭代的開源模型,我們具備彎道超車的能力,因此訓練追趕、推理超車是未來5年我們的策略,而GPNPU則是AI推理芯片架構的最優解。”云天勵飛董事長兼CEO表示。

    云天勵飛發布未來三年算力芯片戰略:聚焦推理效能升級,全線對標英偉達新一代產品

    面向AI推理需求的爆發式增長,云天勵飛如何規劃下一階段芯片研發路線圖?又將如何通過架構創新與技術突破,真正實現算力效率提升與全生命周期成本下降,從而在推理芯片領域實現彎道超車?

    GPNPU架構定義未來三年芯片路線:直指英偉達旗艦級算力產品

    推理時代的勝負手不在單點指標,而在系統級協同:既要承接主流軟件生態,又要在推理負載下實現更優能效與更低時延。

    云天勵飛確立了GPNPU技術路線,并提出了“GPNPU=GPGPU+NPU+3D堆疊存儲”的核心公式,兼顧通用計算的“通用性”與NPU的“高效性”。

    云天勵飛發布未來三年算力芯片戰略:聚焦推理效能升級,全線對標英偉達新一代產品

    在通用生態層面,鑒于CUDA仍是全球最成熟、覆蓋最廣的加速計算平臺之一,云天勵飛的GPNPU架構致力于正視主流生態的遷移成本問題,能夠實現一行代碼完成CUDA程序兼容,極大降低了進入生產系統的門檻。

    在推理能效層面,NPU能夠實現更高的計算效率和能效比,面對大模型推理這種高度結構化、可被體系化優化的負載,專用化設計帶來的能效優勢更容易轉化為真實成本優勢,這也是國際廠商持續加碼專用路線的重要原因。

    同時,針對行業公認的“內存墻”瓶頸,云天勵飛正深度研發 3D 堆疊存儲及更前沿的互連技術,以提升帶寬與能效,降低推理時延。

    “通過引入3D memory架構,我們可以實現10倍于當前訓練芯片HBM帶寬的性能,其訪問時延將達到10納秒級別,以實現極致的推理能效。”云天勵飛CTO李愛軍表示。

    在架構工程與產品化路徑上,云天勵飛提出“算力積木”架構,通過Chiplet擴展與互連思路,將標準計算單元進行模塊化封裝與組合,讓算力像搭積木一樣按需擴展,形成從邊緣到更大規模推理的彈性產品形態。

    其次是面向推理的系統級優化能力,公司拒絕單純的“芯片參數競賽”,而是主張把“模型怎么跑得更省”沉淀到架構里,圍繞真實業務負載持續迭代,逐項擊穿推理鏈路中的成本與時延瓶頸,最終形成可復制交付的解決方案。

    “基于對大模型推理的理解,我們構造了PD分離系統架構,針對大模型prefill和decode階段不同的計算特點進行優化設計,在芯片的微架構層面上,我們同時對于Attention及FFN的計算的特點進行細粒度的分析,從而進一步的去提升我們的推理效率。”李愛軍說到。

    云天勵飛發布未來三年算力芯片戰略:聚焦推理效能升級,全線對標英偉達新一代產品

    會議上,云天勵飛以推進百萬Token推理成本每年兩位數的降低為目標,正式發布了未來三年的大算力芯片規劃。

    2026至2028年,云天勵飛規劃推出三代迭代芯片,節奏清晰對標國際主流廠商。

    第一代超節點P芯片將于今年推出,其將面向百萬長上下文的場景進行極致的prefill推理優化,在算力上緊跟H100。

    2027年,云天勵飛將研發第一代超節點D芯片,以此在decode推理方面實現超低延時,而其算力性能將達到B200 相當的水平。

    2028年,云天勵飛將研發第二代超節點D芯片,致力于實現毫秒級的推理時延,從而使得prefill和decode的性能大幅提升,在算力層面,將對標英偉達的下一代Rubin芯片。

    云天勵飛發布未來三年算力芯片戰略:聚焦推理效能升級,全線對標英偉達新一代產品

    手握「充足」國產產能,云天勵飛打通研發、量產與規模化交付閉環

    算力芯片的競爭已步入新周期,多家公司登陸資本市場之外,還有大量創業公司逐漸嶄露頭角。

    競爭白熱化的行業境況下,陳寧指出,支撐公司跨越周期的,是長期積累構筑的商業護城河。云天勵飛的核心競爭力,已形成技術、產能、生態、市場、資本五大維度的協同。

    GPNPU的架構創新,以及三年大算力芯片規劃的發布,實現了技術與產品的閉環。

    在此之下,產能成為落地的關鍵。

    針對行業普遍關注的供應鏈安全問題,云天勵飛高級副總裁、CFO兼董秘鄧浩然特別強調,公司目前是國內屈指可數手握充足國產產能保障的企業之一,這一戰略儲備為后續芯片的大規模量產與交付提供了極高的確定性。

    此外,云天勵飛受到資本市場的高度關注,具備足夠的資金實力以支撐芯片研發的長期消耗,同時在頂級芯片人才的招攬上,也能夠走在前列。

    云天勵飛發布未來三年算力芯片戰略:聚焦推理效能升級,全線對標英偉達新一代產品

    而為了應對市場競爭以及不確定性,云天勵飛更將組織調整為更具韌性的“1+4”架構。

    “1”指聚焦于AI大算力推理芯片,“4”則是四大事業部。作為生態構建者,四大事業部旨在解決芯片從“研發生產、優化打磨到市場推廣”的核心難題。其中,政企事業部作為基石,將憑借深厚的行業經驗,將戰略重點轉向推理設備和智算中心的建設,以實現業務運轉的協同閉環。

    據悉,云天勵飛正規劃打造區域級“千卡集群”。

    云天勵飛發布未來三年算力芯片戰略:聚焦推理效能升級,全線對標英偉達新一代產品

    推理時代的競爭,本質是“單位推理成本”的競爭。只有把推理做得足夠便宜、足夠穩定、足夠易用,AI才能從“看得見的能力”走向“用得起的生產力”。

    未來,云天勵飛將以GPNPU架構為核心,大力推進云端大算力強化軟硬協同與存儲體系攻堅,實現百萬Tokens推理成本降低超100倍的目標。

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    分享:
    相關文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說