阿里巴巴正式发布并开源了新一代通义千问大语言模型——Qwen3

2025年4月29日凌晨,阿里巴巴正式发布并开源了新一代通义千问大语言模型——Qwen3。该模型在多个技术维度实现了突破,被誉为“全球最强开源模型”之一。


🚀 主要亮点

1. 混合推理架构:快思考与慢思考的融合

Qwen3是国内首个将“快思考”(快速响应)与“慢思考”(深度推理)集成于同一模型的尝试。这种混合推理架构使得模型在处理简单任务时能够迅速响应,而在面对复杂问题时则能进行多步骤的深度推理,从而在性能与效率之间取得平衡。 

2. 多语言支持与大规模预训练

Qwen3支持包括简体中文、繁体中文、粤语在内的119种语言和方言,极大地拓展了其应用范围。在预训练方面,Qwen3使用了约36万亿个Token的数据集,几乎是前代模型Qwen2.5的两倍,显著提升了模型的语言理解和生成能力。 

3. 多样化的模型版本

Qwen3系列包括2个混合专家(MoE)模型和6个稠密模型,参数规模从0.6B到235B不等,满足从轻量级应用到高性能计算的多种需求。其中,旗舰模型Qwen3-235B-A22B在编码、数学、通用能力等基准评估中取得了竞争力的结果。

4. 高效的上下文处理能力

Qwen3支持高达256K的上下文长度,能够处理更长的输入文本,提升了在复杂任务中的表现。 


🔧 开源与适配

阿里云已将Qwen3系列模型全面开源,涵盖了多个版本,用户可以通过通义App和通义网页版中的“千问大模型”智能体体验这些高性能模型的应用。同时,Qwen3已在华为MindSpeed和MindIE平台实现开箱即用,并在海光DCU上完成了无缝适配和调优。 


Qwen3的发布标志着阿里巴巴在大语言模型领域的又一重大进展,展示了其在AI技术研发和应用方面的强大实力。未来,Qwen3有望在更多实际场景中发挥重要作用,推动人工智能技术的进一步发展。 


已发布

分类

来自

标签: