阿里发布最强开源模型Qwen3,成本仅为DeepSeek-R1三分之一
4月29日凌晨,阿里巴巴开源新一代通义千问模型 Qwen3
(简称千问3),参数量仅为 DeepSeek-R1
的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1
等领先模型,登顶全球最强开源模型。
根据官方的说法,千问3的旗舰版本 Qwen3-235B-A22B
,在代码、数学、通用能力等基准测试中,达到了与 DeepSeek-R1
、o1
、o3-mini
、Grok-3
和 Gemini-2.5-Pro
同一梯度的水平。此外,小型MoE模型Qwen3-30B-A3B
的激活参数数量是QwQ-32B
的10%,表现更胜一筹,甚至像Qwen3-4B
这样的小模型也能匹敌Qwen2.5-72B-Instruct
的性能。Qwen3
总参数量235B,刷新了开源模型的智能水平新高,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。
Qwen3
模型依旧采用宽松的 Apache2.0
协议开源,全球开发者、研究机构和企业均可免费在 HuggingFace
、魔搭社区等平台下载模型并商用,也可以通过阿里云百炼调用 Qwen3
的 API 服务。