阿里巴巴正式发布并开源了新一代通义千问大语言模型——Qwen3

2025年4月29日凌晨，阿里巴巴正式发布并开源了新一代通义千问大语言模型——Qwen3。该模型在多个技术维度实现了突破，被誉为“全球最强开源模型”之一。

Qwen3是国内首个将“快思考”（快速响应）与“慢思考”（深度推理）集成于同一模型的尝试。这种混合推理架构使得模型在处理简单任务时能够迅速响应，而在面对复杂问题时则能进行多步骤的深度推理，从而在性能与效率之间取得平衡。

Qwen3支持包括简体中文、繁体中文、粤语在内的119种语言和方言，极大地拓展了其应用范围。在预训练方面，Qwen3使用了约36万亿个Token的数据集，几乎是前代模型Qwen2.5的两倍，显著提升了模型的语言理解和生成能力。

Qwen3系列包括2个混合专家（MoE）模型和6个稠密模型，参数规模从0.6B到235B不等，满足从轻量级应用到高性能计算的多种需求。其中，旗舰模型Qwen3-235B-A22B在编码、数学、通用能力等基准评估中取得了竞争力的结果。

Qwen3支持高达256K的上下文长度，能够处理更长的输入文本，提升了在复杂任务中的表现。

阿里云已将Qwen3系列模型全面开源，涵盖了多个版本，用户可以通过通义App和通义网页版中的“千问大模型”智能体体验这些高性能模型的应用。同时，Qwen3已在华为MindSpeed和MindIE平台实现开箱即用，并在海光DCU上完成了无缝适配和调优。

Qwen3的发布标志着阿里巴巴在大语言模型领域的又一重大进展，展示了其在AI技术研发和应用方面的强大实力。未来，Qwen3有望在更多实际场景中发挥重要作用，推动人工智能技术的进一步发展。