阿里发布最强开源模型Qwen3，成本仅为DeepSeek-R1三分之一

4月29日凌晨，阿里巴巴开源新一代通义千问模型 Qwen3（简称千问3），参数量仅为 DeepSeek-R1 的1/3，成本大幅下降，性能全面超越R1、OpenAI-o1等领先模型，登顶全球最强开源模型。

根据官方的说法，千问3的旗舰版本 Qwen3-235B-A22B，在代码、数学、通用能力等基准测试中，达到了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 同一梯度的水平。此外，小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B的10%，表现更胜一筹，甚至像Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。Qwen3 总参数量235B，刷新了开源模型的智能水平新高，阿里称仅需4张H20即可部署千问3满血版，显存占用仅为性能相近模型的三分之一。

Qwen3 模型依旧采用宽松的 Apache2.0 协议开源，全球开发者、研究机构和企业均可免费在 HuggingFace、魔搭社区等平台下载模型并商用，也可以通过阿里云百炼调用 Qwen3 的 API 服务。

发表评论

阿里发布最强开源模型Qwen3，成本仅为DeepSeek-R1三分之一

发表评论

表情类型

目录