阿里发布通义千问Qwen3-Max：万亿参数AI大模型登场

当前位置 : 首页>电脑数码>阿里发布通义千问Qwen3-Max：万亿参数AI大模型登场

阿里发布通义千问Qwen3-Max：万亿参数AI大模型登场

【太平洋科技快讯】9月24日消息，阿里通义千问团队正式推出Qwen3-Max模型，这是该团队迄今为止规模最大、能力最强的AI大模型。该模型总参数超过1T，预训练使用了高达36T tokens的数据。

Qwen3-Max包含三个版本：Base、Instruct和Thinking思。其中，Qwen3-Max-Instruct正式版已经上线Qwen Chat并在阿里云百炼提供API服务。

根据官方公布的信息，Qwen3-Max-Instruct的预览版在LMArena文本排行榜上稳居全球前三，超越了GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升，在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

在专注于解决现实编程挑战的基准测试SWE-Bench Verified上，Qwen3-Max-Instruct取得了高达69.6分的优秀成绩。在评估智能体工具调用能力的Tau2-Bench上，它以74.8分超越Claude Opus 4与DeepSeek-V3.1。

Qwen3-Max-Thinking作为推理增强版本，虽仍在训练中，但已展现出非凡潜力。该版本通过集成代码解释器并运用并行测试时计算技术，展现了前所未有的推理能力。在极具挑战性的数学推理基准测试中，如AIME 25和HMMT，Qwen3-Max-Thinking均取得了满分的优异成绩，这表明其在复杂逻辑推理方面具有突出能力。

Qwen3-Max沿用了Qwen3系列的模型结构设计范式，使用了global-batch load balancing loss。这一架构使训练过程稳定平滑，没有出现loss尖刺。在训练效率方面，PAI-FlashMoE 多级流水并行策略优化下Qwen3-Max-Base的模型MFU相比Qwen2.5-Max-Base相对提升30%。同时，其支持1M长上下文训练，在长序列训练场景中表现出色。

目前，用户可以通过Qwen Chat官网直接与Qwen3-Max-Instruct模型对话，其API也已开放使用。这一万亿参数级大模型的正式发布，标志着中国在全球AI大模型竞争中的地位进一步提升，为各行各业提供更强大的AI能力支持。