阿里發(fā)布千問(wèn)3.5，性能媲美Gemini 3， Token價(jià)格僅為其1/18

本文作者：徐咪

2026-02-16 17:10

導(dǎo)語(yǔ)：2月16日除夕當(dāng)天，阿里巴巴開(kāi)源全新一代大模型千問(wèn)Qwen3.5-Plus，性能媲美Gemini 3 Pro，登頂全球最強(qiáng)開(kāi)源模型。

2月16日除夕當(dāng)天，阿里巴巴開(kāi)源全新一代大模型千問(wèn)Qwen3.5-Plus，性能媲美Gemini 3 Pro，登頂全球最強(qiáng)開(kāi)源模型。千問(wèn)3.5實(shí)現(xiàn)了底層模型架構(gòu)的全面革新，此次發(fā)布的Qwen3.5-Plus版本總參數(shù)為3970億，激活僅170億，以小勝大，性能超過(guò)萬(wàn)億參數(shù)的Qwen3-Max模型，部署顯存占用降低60%，推理效率大幅提升，最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API價(jià)格每百萬(wàn)Token低至0.8元，僅為Gemini 3 Pro的1/18。

與前幾代的千問(wèn)大語(yǔ)言模型不同，千問(wèn)3.5實(shí)現(xiàn)了從純文本模型到原生多模態(tài)模型的代際躍遷。千問(wèn)3預(yù)訓(xùn)練在純文本Tokens上進(jìn)行，而千問(wèn)3.5則基于視覺(jué)和文本混合token上預(yù)訓(xùn)練，并大幅新增中英文、多語(yǔ)言、STEM和推理等數(shù)據(jù)，讓張開(kāi)“眼睛”的大模型學(xué)會(huì)了更密集的世界知識(shí)和推理邏輯，以不到40%的參數(shù)量獲得超萬(wàn)億的Qwen3-Max基座模型的頂尖性能，在推理、編程、Agent智能體等全方位基準(zhǔn)評(píng)估中均表現(xiàn)優(yōu)異。比如，千問(wèn)3.5在MMLU-Pro知識(shí)推理評(píng)測(cè)中得分87.8分，超越GPT-5.2；在博士級(jí)難題GPQA測(cè)評(píng)中斬獲88.4分，高于Claude 4.5；在指令遵循IFBench以76.5分刷新所有模型紀(jì)錄；而在通用Agent評(píng)測(cè)BFCL-V4、搜索Agent評(píng)測(cè)Browsecomp等基準(zhǔn)中，千問(wèn)3.5表現(xiàn)均超越Gemini 3 Pro、GPT-5.2。

阿里發(fā)布千問(wèn)3.5，性能媲美Gemini 3， Token價(jià)格僅為其1/18 圖說(shuō)：阿里開(kāi)源千問(wèn)Qwen3.5-Plus，性能媲美Gemini 3 Pro

原生多模態(tài)訓(xùn)練，也帶來(lái)千問(wèn)3.5的視覺(jué)能力飛躍：在多模態(tài)推理（MathVison）、通用視覺(jué)問(wèn)答VQA（RealWorldQA）、文本識(shí)別和文件理解（CC_OCR）、空間智能（RefCOCO-avg）、視頻理解（MLVU）等眾多權(quán)威評(píng)測(cè)中，千問(wèn)3.5均斬獲最佳性能。在學(xué)科解題、任務(wù)規(guī)劃與物理空間推理等任務(wù)上，千問(wèn)3.5相比千問(wèn)專項(xiàng)模型Qwen3-VL表現(xiàn)更好，空間定位推理和帶圖推理能力均大幅增強(qiáng)，推理分析更精細(xì)、精準(zhǔn)；在視頻理解方面，千問(wèn)3.5支持長(zhǎng)達(dá)2小時(shí)（1M token上下文）的視頻直接輸入，適用于長(zhǎng)視頻內(nèi)容分析與摘要生成；同時(shí)，千問(wèn)3.5實(shí)現(xiàn)了視覺(jué)理解與代碼能力的原生融合，結(jié)合圖搜和生圖工具，可將手繪界面草圖直接轉(zhuǎn)為可用的前端代碼，一張截圖就能定位并修復(fù)UI問(wèn)題，讓視覺(jué)編程真正成為生產(chǎn)力工具。

千問(wèn)3.5性能躍升的背后，是對(duì)Transformer經(jīng)典架構(gòu)的重大創(chuàng)新突破。千問(wèn)團(tuán)隊(duì)自研的門(mén)控技術(shù)成果，曾斬獲全球AI頂會(huì)2025 NeurIPS最佳論文，該前沿技術(shù)已融入到千問(wèn)3.5創(chuàng)新的混合架構(gòu)中去，團(tuán)隊(duì)結(jié)合線性注意力機(jī)制與稀疏混合專家MoE模型架構(gòu)，實(shí)現(xiàn)了397B總參數(shù)激活僅17B的極致模型效率；同時(shí)，千問(wèn)3.5通過(guò)訓(xùn)練穩(wěn)定優(yōu)化以及多 token 預(yù)測(cè)等系列技術(shù)，Qwen3.5性能與Qwen3-Max模型持平，并進(jìn)一步提升了推理效率：在常用的32K上下文場(chǎng)景中，千問(wèn)3.5推理吞吐量可提升8.6倍；在256K超長(zhǎng)上下文情況下，Qwen3.5推理吞吐量最大提升至19倍，推理效率大幅提升。

阿里發(fā)布千問(wèn)3.5，性能媲美Gemini 3， Token價(jià)格僅為其1/18 圖說(shuō)：千問(wèn)3.5推理效率大幅提升，最大吞吐量提升至19倍

千問(wèn)3.5的原生多模態(tài)訓(xùn)練，是在阿里云AI基礎(chǔ)設(shè)施上高效完成的。通過(guò)系列基礎(chǔ)技術(shù)創(chuàng)新，千問(wèn)3.5在文本、圖像、視頻等混合數(shù)據(jù)訓(xùn)練吞吐量，幾近100%持平純文本基座模型訓(xùn)練，大舉降低了原生多模態(tài)訓(xùn)練的難度門(mén)檻；同時(shí)，通過(guò)設(shè)計(jì)精巧的FP8、FP32精度應(yīng)用策略，在訓(xùn)練穩(wěn)定擴(kuò)展到數(shù)十萬(wàn)億個(gè)token時(shí)，激活內(nèi)存減少約50% ，訓(xùn)練還能提速10% ，進(jìn)一步節(jié)約了模型訓(xùn)練成本、提升了訓(xùn)練效率。

基于頂級(jí)視覺(jué)能力，千問(wèn)3.5也實(shí)現(xiàn)了從Agent框架到Agent應(yīng)用的新突破。千問(wèn)3.5可自主操作手機(jī)與電腦，高效完成日常任務(wù)，在移動(dòng)端支持更多主流APP與指令，在PC端可處理更復(fù)雜的多步驟操作，如跨應(yīng)用數(shù)據(jù)整理、自動(dòng)化流程執(zhí)行等，顯著提升操作效率。同時(shí)，千問(wèn)團(tuán)隊(duì)構(gòu)建了一個(gè)可擴(kuò)展的Agent異步強(qiáng)化學(xué)習(xí)框架，端到端可加速3到5倍，并將插件式智能體Agent支持?jǐn)U展至百萬(wàn)級(jí)規(guī)模。

1月15日，千問(wèn)App發(fā)布全球首個(gè)消費(fèi)級(jí)AI購(gòu)物Agent。春節(jié)期間，千問(wèn)AI購(gòu)物Agent6天時(shí)間幫用戶完成了1.2億筆訂單，在全球首次實(shí)現(xiàn)大規(guī)模真實(shí)世界任務(wù)執(zhí)行和商業(yè)化驗(yàn)證。Agent能力大幅增強(qiáng)的千問(wèn)3.5，將進(jìn)一步打開(kāi)千問(wèn)APP在工作和生活中幫人辦事的想象空間。

自2023年開(kāi)源以來(lái)，阿里已開(kāi)源400多個(gè)千問(wèn)模型，覆蓋全尺寸、全模態(tài)，千問(wèn)全球下載量突破10億次，單月下載量是DeepSeek、Meta、OpenAI、智譜、Kimi、MiniMax等2到8名總和，開(kāi)發(fā)者基于千問(wèn)開(kāi)發(fā)的衍生模型超20萬(wàn)，是公認(rèn)的全球第一開(kāi)源模型，也是開(kāi)發(fā)者最友好的開(kāi)源大模型。面向不同國(guó)家的AI開(kāi)發(fā)者和企業(yè)的需求，千問(wèn)大模型還在持續(xù)演進(jìn)：千問(wèn)3.5擴(kuò)展支持201種語(yǔ)言，將詞表大小從15萬(wàn)擴(kuò)展到25萬(wàn)，可最高提升小語(yǔ)種60%的編碼效率。

據(jù)悉，千問(wèn)APP、PC端已第一時(shí)間接入Qwen3.5-Plus模型。開(kāi)發(fā)者可在魔搭社區(qū)和HuggingFace下載新模型，或通過(guò)阿里云百煉直接獲取API服務(wù)。阿里很快將繼續(xù)開(kāi)源不同尺寸、不同功能的千問(wèn)3.5系列模型。性能更強(qiáng)的旗艦?zāi)Ｐ蚎wen3.5-Max不久也將發(fā)布。

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

徐咪

編輯

發(fā)私信

當(dāng)月熱門(mén)文章