丁丁打折网 - 网友优惠券分享网站,有688999个用户

京东优惠券 小米有品优惠券

当前位置 : 首页>电脑数码>阿里发布通义千问Qwen3-Max:万亿参数AI大模型登场

阿里发布通义千问Qwen3-Max:万亿参数AI大模型登场

类别:电脑数码 发布时间:2025-09-24 12:39

【太平洋科技快讯】9月24日消息,阿里通义千问团队正式推出Qwen3-Max模型,这是该团队迄今为止规模最大、能力最强的AI大模型。该模型总参数超过1T,预训练使用了高达36T tokens的数据。

Qwen3-Max包含三个版本:Base、Instruct和Thinking思。其中,Qwen3-Max-Instruct正式版已经上线Qwen Chat并在阿里云百炼提供API服务。

根据官方公布的信息,Qwen3-Max-Instruct的预览版在LMArena文本排行榜上稳居全球前三,超越了GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

在专注于解决现实编程挑战的基准测试SWE-Bench Verified上,Qwen3-Max-Instruct取得了高达69.6分的优秀成绩。在评估智能体工具调用能力的Tau2-Bench上,它以74.8分超越Claude Opus 4与DeepSeek-V3.1。

Qwen3-Max-Thinking作为推理增强版本,虽仍在训练中,但已展现出非凡潜力。该版本通过集成代码解释器并运用并行测试时计算技术,展现了前所未有的推理能力。在极具挑战性的数学推理基准测试中,如AIME 25和HMMT,Qwen3-Max-Thinking均取得了满分的优异成绩,这表明其在复杂逻辑推理方面具有突出能力。

Qwen3-Max沿用了Qwen3系列的模型结构设计范式,使用了global-batch load balancing loss。这一架构使训练过程稳定平滑,没有出现loss尖刺。在训练效率方面,PAI-FlashMoE 多级流水并行策略优化下Qwen3-Max-Base的模型MFU相比Qwen2.5-Max-Base相对提升30%。同时,其支持1M长上下文训练,在长序列训练场景中表现出色。

目前,用户可以通过Qwen Chat官网直接与Qwen3-Max-Instruct模型对话,其API也已开放使用。这一万亿参数级大模型的正式发布,标志着中国在全球AI大模型竞争中的地位进一步提升,为各行各业提供更强大的AI能力支持。

丁丁打折网©版权所有,未经许可严禁复制或镜像 ICP证: 湘ICP备20009233号-2

Powered by 丁丁打折网本站为非营利性网站,本站内容均来自网络转载或网友提供,如有侵权或夸大不实请及时联系我们删除!本站不承担任何争议和法律责任!
技术支持:丁丁网 dddazhe@hotmail.com & 2010-2020 All rights reserved