眾智FlagOS實現(xiàn)面壁新模型MiniCPM-o 4.5：“發(fā)布即適配”性能全面反超原生

本文作者：二維馬曉寧

2026-02-06 15:16

導(dǎo)語：這標(biāo)志著國產(chǎn)基礎(chǔ)軟件在破解“跨芯適配難”行業(yè)痛點上取得里程碑式突破。

雷峰網(wǎng)(公眾號：雷峰網(wǎng))訊 2026年2月3日，面壁智能正式發(fā)布并開源了集語言、視覺、語音于一體的全模態(tài)大模型 MiniCPM-o 4.5，眾智FlagOS系統(tǒng)軟件棧，成功助力該模型在發(fā)布當(dāng)日即完成對六大主流AI芯片的適配與優(yōu)化，并實現(xiàn)端到端推理性能全面超越各芯片原生方案，這標(biāo)志著國產(chǎn)基礎(chǔ)軟件在破解“跨芯適配難”行業(yè)痛點上取得里程碑式突破。

作為首個全雙工全模態(tài)大模型，面壁MiniCPM-o 4.5 首次實現(xiàn)“類人”感知交互，能夠根據(jù)環(huán)境“邊看、邊聽、邊說”，保證輸入輸出實時同步。這就對底層推理系統(tǒng)的計算效率、資源調(diào)度與多模態(tài)數(shù)據(jù)流的低延遲處理能力提出了極高要求。對此，眾智 FlagOS 憑借其統(tǒng)一、高性能的跨芯片系統(tǒng)軟件棧，提供了從算子優(yōu)化到編譯調(diào)度的全鏈路加速方案，有效解決了大模型在多元硬件上保持高實時性、高吞吐推理的關(guān)鍵難題，實現(xiàn)了“一次開發(fā)，跨芯運行”的效果。

在確保模型精度無損失的前提下，基于 FlagOS 版本的MiniCPM-o 4.5在全部六款芯片上均實現(xiàn)了端到端推理效率的顯著提升，不同場景下平均加速比為7.76%—22.4%。在統(tǒng)一硬件條件下，F(xiàn)lagOS 版本相比 CUDA 版本提升端到端推理效率 6.10%，與各芯片自身的原生系統(tǒng)軟件棧相比，F(xiàn)lagOS 帶來的性能提升更為顯著，例如在 Nvidia 硬件上提升 6.10%，在 Hygon 硬件上提升 4.57%，整體平均提升幅度突出。而在長負載任務(wù)的平均測試中，F(xiàn)lagOS 版本的端到端性能比例達到 106.10%，全面驗證了其優(yōu)化效果。這一系列數(shù)據(jù)強有力地證明，F(xiàn)lagOS不僅解決了“有沒有”的適配問題，更實現(xiàn)了“好不好”的性能超越，為應(yīng)用方提供了更具性價比的多元算力選擇。

此次合作的成功實踐，為面臨硬件適配困境的模型廠商提供了明確路徑，通過集成FlagOS這類統(tǒng)一軟件棧，能夠以較低成本快速實現(xiàn)模型在多芯片平臺的高性能部署，從而將研發(fā)重心回歸模型創(chuàng)新本身。隨著FlagOS生態(tài)的持續(xù)發(fā)展，其“一次開發(fā)、多芯運行”的能力有望成為AI應(yīng)用生態(tài)的重要基礎(chǔ)，推動大模型技術(shù)更高效、更經(jīng)濟地服務(wù)于各行各業(yè)。隨著FlagOS生態(tài)的持續(xù)發(fā)展，有望成為驅(qū)動AI應(yīng)用生態(tài)繁榮的關(guān)鍵基礎(chǔ)設(shè)施，最終推動大模型技術(shù)以更低的部署成本、更靈活的硬件選擇，加速賦能千行百業(yè)。

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

二維馬曉寧

編輯

發(fā)私信

當(dāng)月熱門文章