0
| 本文作者: 二維馬曉寧 | 2026-02-06 15:16 |
雷峰網(wǎng)(公眾號:雷峰網(wǎng))訊 2026年2月3日,面壁智能正式發(fā)布并開源了集語言、視覺、語音于一體的全模態(tài)大模型 MiniCPM-o 4.5,眾智FlagOS系統(tǒng)軟件棧,成功助力該模型在發(fā)布當(dāng)日即完成對六大主流AI芯片的適配與優(yōu)化,并實現(xiàn)端到端推理性能全面超越各芯片原生方案,這標(biāo)志著國產(chǎn)基礎(chǔ)軟件在破解“跨芯適配難”行業(yè)痛點上取得里程碑式突破。
作為首個全雙工全模態(tài)大模型,面壁MiniCPM-o 4.5 首次實現(xiàn)“類人”感知交互,能夠根據(jù)環(huán)境“邊看、邊聽、邊說”,保證輸入輸出實時同步。這就對底層推理系統(tǒng)的計算效率、資源調(diào)度與多模態(tài)數(shù)據(jù)流的低延遲處理能力提出了極高要求。對此,眾智 FlagOS 憑借其統(tǒng)一、高性能的跨芯片系統(tǒng)軟件棧,提供了從算子優(yōu)化到編譯調(diào)度的全鏈路加速方案,有效解決了大模型在多元硬件上保持高實時性、高吞吐推理的關(guān)鍵難題,實現(xiàn)了“一次開發(fā),跨芯運行”的效果。
在確保模型精度無損失的前提下,基于 FlagOS 版本的MiniCPM-o 4.5在全部六款芯片上均實現(xiàn)了端到端推理效率的顯著提升,不同場景下平均加速比為7.76%—22.4%。在統(tǒng)一硬件條件下,F(xiàn)lagOS 版本相比 CUDA 版本提升端到端推理效率 6.10%,與各芯片自身的原生系統(tǒng)軟件棧相比,F(xiàn)lagOS 帶來的性能提升更為顯著,例如在 Nvidia 硬件上提升 6.10%,在 Hygon 硬件上提升 4.57%,整體平均提升幅度突出。而在長負載任務(wù)的平均測試中,F(xiàn)lagOS 版本的端到端性能比例達到 106.10%,全面驗證了其優(yōu)化效果。這一系列數(shù)據(jù)強有力地證明,F(xiàn)lagOS不僅解決了“有沒有”的適配問題,更實現(xiàn)了“好不好”的性能超越,為應(yīng)用方提供了更具性價比的多元算力選擇。
此次合作的成功實踐,為面臨硬件適配困境的模型廠商提供了明確路徑,通過集成FlagOS這類統(tǒng)一軟件棧,能夠以較低成本快速實現(xiàn)模型在多芯片平臺的高性能部署,從而將研發(fā)重心回歸模型創(chuàng)新本身。隨著FlagOS生態(tài)的持續(xù)發(fā)展,其“一次開發(fā)、多芯運行”的能力有望成為AI應(yīng)用生態(tài)的重要基礎(chǔ),推動大模型技術(shù)更高效、更經(jīng)濟地服務(wù)于各行各業(yè)。隨著FlagOS生態(tài)的持續(xù)發(fā)展,有望成為驅(qū)動AI應(yīng)用生態(tài)繁榮的關(guān)鍵基礎(chǔ)設(shè)施,最終推動大模型技術(shù)以更低的部署成本、更靈活的硬件選擇,加速賦能千行百業(yè)。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。