0
12月23日,全球權(quán)威AI基準(zhǔn)測試平臺Artificial Analysis公布了最新的圖像模型榜單,阿里6B參數(shù)Z-Image Turbo超越32B的FLUX.2,成為最強開源圖像生成模型。目前,該模型已在阿里云百煉上線,生成1千張圖片僅需5美元。
阿里Z-Image Turbo超越FLUX.2,登頂Artificial Analysis圖像模型榜單
根據(jù)Artificial Analysis官方顯示,Z-Image Turbo的ELO分?jǐn)?shù)達到1152,刷新榜單紀(jì)錄。業(yè)內(nèi)人士認(rèn)為,這是業(yè)界性能最好、生成速度最快、價格最便宜的圖像生成模型之一。
Z-Image Turbo支持16GB顯存的消費級顯卡部署,H100部署環(huán)境下僅需1秒就能生成媲美百億參數(shù)模型效果的圖片。在生成效果上,該模型大幅提升圖像的真實感,能精細還原皮膚紋理、發(fā)絲、服裝材質(zhì)等細節(jié);增強了中英雙語文本渲染能力,例如在小字號、復(fù)雜排版或海報設(shè)計等高難度場景下,也能保持文字清晰、版式自然。
Z-Image Turbo能生成超真實圖片、中英文海報
據(jù)介紹,Z-Image Turbo集成了多項創(chuàng)新技術(shù)。在架構(gòu)層設(shè)計上,采用單流擴散 Transformer,將文本、圖像潛變量與時間步條件統(tǒng)一為單序列輸入,實現(xiàn)跨模態(tài)融合,顯著提升參數(shù)利用率 ;在推理層面,通過解耦式蒸餾與強化學(xué)習(xí)訓(xùn)練,將原本需要20步以上的推理流程縮短到8步,有效提升圖像生成速度;此外,通過提示詞增強器,Z-Image Turbo能先理解復(fù)雜任務(wù)再生成圖片,例如用戶輸入「生一道殘陽鋪水中,半江瑟瑟半江紅」,模型能精準(zhǔn)理解并生成匹配詩句意境的圖片。
用戶輸入「一道殘陽鋪水中,半江瑟瑟半江紅」,Z-Image Turbo能把古詩畫出來
11月底,Z-Image Turbo面向全球開源,開源首日即登頂Hugging Face熱榜第一位,并連續(xù)三周霸榜。不到一個月,該模型下載量已超400萬,是近期最受歡迎的圖像生成模型。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。