0
| 本文作者: 徐咪 | 2026-02-16 17:10 |
2月16日除夕當(dāng)天,阿里巴巴開(kāi)源全新一代大模型千問(wèn)Qwen3.5-Plus,性能媲美Gemini 3 Pro,登頂全球最強(qiáng)開(kāi)源模型。千問(wèn)3.5實(shí)現(xiàn)了底層模型架構(gòu)的全面革新,此次發(fā)布的Qwen3.5-Plus版本總參數(shù)為3970億,激活僅170億,以小勝大,性能超過(guò)萬(wàn)億參數(shù)的Qwen3-Max模型,部署顯存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API價(jià)格每百萬(wàn)Token低至0.8元,僅為Gemini 3 Pro的1/18。
與前幾代的千問(wèn)大語(yǔ)言模型不同,千問(wèn)3.5實(shí)現(xiàn)了從純文本模型到原生多模態(tài)模型的代際躍遷。千問(wèn)3預(yù)訓(xùn)練在純文本Tokens上進(jìn)行,而千問(wèn)3.5則基于視覺(jué)和文本混合token上預(yù)訓(xùn)練,并大幅新增中英文、多語(yǔ)言、STEM和推理等數(shù)據(jù),讓張開(kāi)“眼睛”的大模型學(xué)會(huì)了更密集的世界知識(shí)和推理邏輯,以不到40%的參數(shù)量獲得超萬(wàn)億的Qwen3-Max基座模型的頂尖性能,在推理、編程、Agent智能體等全方位基準(zhǔn)評(píng)估中均表現(xiàn)優(yōu)異。比如,千問(wèn)3.5在MMLU-Pro知識(shí)推理評(píng)測(cè)中得分87.8分,超越GPT-5.2;在博士級(jí)難題GPQA測(cè)評(píng)中斬獲88.4分,高于Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型紀(jì)錄;而在通用Agent評(píng)測(cè)BFCL-V4、搜索Agent評(píng)測(cè)Browsecomp等基準(zhǔn)中,千問(wèn)3.5表現(xiàn)均超越Gemini 3 Pro、GPT-5.2。
圖說(shuō):阿里開(kāi)源千問(wèn)Qwen3.5-Plus,性能媲美Gemini 3 Pro
原生多模態(tài)訓(xùn)練,也帶來(lái)千問(wèn)3.5的視覺(jué)能力飛躍:在多模態(tài)推理(MathVison)、通用視覺(jué)問(wèn)答VQA(RealWorldQA)、文本識(shí)別和文件理解(CC_OCR)、空間智能(RefCOCO-avg)、視頻理解(MLVU)等眾多權(quán)威評(píng)測(cè)中,千問(wèn)3.5均斬獲最佳性能。在學(xué)科解題、任務(wù)規(guī)劃與物理空間推理等任務(wù)上,千問(wèn)3.5相比千問(wèn)專項(xiàng)模型Qwen3-VL表現(xiàn)更好,空間定位推理和帶圖推理能力均大幅增強(qiáng),推理分析更精細(xì)、精準(zhǔn);在視頻理解方面,千問(wèn)3.5支持長(zhǎng)達(dá)2小時(shí)(1M token上下文)的視頻直接輸入,適用于長(zhǎng)視頻內(nèi)容分析與摘要生成;同時(shí),千問(wèn)3.5實(shí)現(xiàn)了視覺(jué)理解與代碼能力的原生融合,結(jié)合圖搜和生圖工具,可將手繪界面草圖直接轉(zhuǎn)為可用的前端代碼,一張截圖就能定位并修復(fù)UI問(wèn)題,讓視覺(jué)編程真正成為生產(chǎn)力工具。
千問(wèn)3.5性能躍升的背后,是對(duì)Transformer經(jīng)典架構(gòu)的重大創(chuàng)新突破。千問(wèn)團(tuán)隊(duì)自研的門(mén)控技術(shù)成果,曾斬獲全球AI頂會(huì)2025 NeurIPS最佳論文,該前沿技術(shù)已融入到千問(wèn)3.5創(chuàng)新的混合架構(gòu)中去,團(tuán)隊(duì)結(jié)合線性注意力機(jī)制與稀疏混合專家MoE模型架構(gòu),實(shí)現(xiàn)了397B總參數(shù)激活僅17B的極致模型效率;同時(shí),千問(wèn)3.5通過(guò)訓(xùn)練穩(wěn)定優(yōu)化以及多 token 預(yù)測(cè)等系列技術(shù),Qwen3.5性能與Qwen3-Max模型持平,并進(jìn)一步提升了推理效率:在常用的32K上下文場(chǎng)景中,千問(wèn)3.5推理吞吐量可提升8.6倍;在256K超長(zhǎng)上下文情況下,Qwen3.5推理吞吐量最大提升至19倍,推理效率大幅提升。
圖說(shuō):千問(wèn)3.5推理效率大幅提升,最大吞吐量提升至19倍
千問(wèn)3.5的原生多模態(tài)訓(xùn)練,是在阿里云AI基礎(chǔ)設(shè)施上高效完成的。通過(guò)系列基礎(chǔ)技術(shù)創(chuàng)新,千問(wèn)3.5在文本、圖像、視頻等混合數(shù)據(jù)訓(xùn)練吞吐量,幾近100%持平純文本基座模型訓(xùn)練,大舉降低了原生多模態(tài)訓(xùn)練的難度門(mén)檻;同時(shí),通過(guò)設(shè)計(jì)精巧的FP8、FP32精度應(yīng)用策略,在訓(xùn)練穩(wěn)定擴(kuò)展到數(shù)十萬(wàn)億個(gè)token時(shí),激活內(nèi)存減少約50% ,訓(xùn)練還能提速10% ,進(jìn)一步節(jié)約了模型訓(xùn)練成本、提升了訓(xùn)練效率。
基于頂級(jí)視覺(jué)能力,千問(wèn)3.5也實(shí)現(xiàn)了從Agent框架到Agent應(yīng)用的新突破。千問(wèn)3.5可自主操作手機(jī)與電腦,高效完成日常任務(wù),在移動(dòng)端支持更多主流APP與指令,在PC端可處理更復(fù)雜的多步驟操作,如跨應(yīng)用數(shù)據(jù)整理、自動(dòng)化流程執(zhí)行等,顯著提升操作效率。同時(shí),千問(wèn)團(tuán)隊(duì)構(gòu)建了一個(gè)可擴(kuò)展的Agent異步強(qiáng)化學(xué)習(xí)框架,端到端可加速3到5倍,并將插件式智能體Agent支持?jǐn)U展至百萬(wàn)級(jí)規(guī)模。
1月15日,千問(wèn)App發(fā)布全球首個(gè)消費(fèi)級(jí)AI購(gòu)物Agent。春節(jié)期間,千問(wèn)AI購(gòu)物Agent6天時(shí)間幫用戶完成了1.2億筆訂單,在全球首次實(shí)現(xiàn)大規(guī)模真實(shí)世界任務(wù)執(zhí)行和商業(yè)化驗(yàn)證。Agent能力大幅增強(qiáng)的千問(wèn)3.5,將進(jìn)一步打開(kāi)千問(wèn)APP在工作和生活中幫人辦事的想象空間。
自2023年開(kāi)源以來(lái),阿里已開(kāi)源400多個(gè)千問(wèn)模型,覆蓋全尺寸、全模態(tài),千問(wèn)全球下載量突破10億次,單月下載量是DeepSeek、Meta、OpenAI、智譜、Kimi、MiniMax等2到8名總和,開(kāi)發(fā)者基于千問(wèn)開(kāi)發(fā)的衍生模型超20萬(wàn),是公認(rèn)的全球第一開(kāi)源模型,也是開(kāi)發(fā)者最友好的開(kāi)源大模型。面向不同國(guó)家的AI開(kāi)發(fā)者和企業(yè)的需求,千問(wèn)大模型還在持續(xù)演進(jìn):千問(wèn)3.5擴(kuò)展支持201種語(yǔ)言,將詞表大小從15萬(wàn)擴(kuò)展到25萬(wàn),可最高提升小語(yǔ)種60%的編碼效率。
據(jù)悉,千問(wèn)APP、PC端已第一時(shí)間接入Qwen3.5-Plus模型。開(kāi)發(fā)者可在魔搭社區(qū)和HuggingFace下載新模型,或通過(guò)阿里云百煉直接獲取API服務(wù)。阿里很快將繼續(xù)開(kāi)源不同尺寸、不同功能的千問(wèn)3.5系列模型。性能更強(qiáng)的旗艦?zāi)P蚎wen3.5-Max不久也將發(fā)布。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。