丁丁打折网 - 网友优惠券分享网站,有688999个用户

京东优惠券 小米有品优惠券

当前位置 : 首页>电脑数码>150 tokens/s!NVIDIA为谷歌DiffusionGemma提供首日支持:RTX/DGX全系可用

150 tokens/s!NVIDIA为谷歌DiffusionGemma提供首日支持:RTX/DGX全系可用

类别:电脑数码 发布时间:2026-06-11 12:55

6月11日消息,NVIDIA宣布为谷歌DeepMind最新发布的开放模型DiffusionGemma提供首日支持,覆盖GeForce RTX GPU、RTX PRO平台和DGX系统全系列。

DiffusionGemma基于Gemma 4架构,总参数25.2亿,推理时仅激活3.8亿参数,支持256K上下文长度,并针对NVIDIA硬件深度优化。。

150 tokens/s!NVIDIA为谷歌DiffusionGemma提供首日支持:RTX/DGX全系可用

与传统自回归模型逐个生成token不同,它采用文本扩散架构,每步可并行去噪256个tokens,在NVIDIA GPU上速度提升约4倍。

性能方面,NVIDIA通过Tensor Core架构和CUDA软件栈实现了无需额外调优即可获得优异性能。单块H100 GPU可达每秒1000 token,在DGX Spark上达150 tokens/s。

该模型支持BF16/NVFP4精度格式,开发者可通过Hugging Face Transformers在RTX 5090或DGX Spark上快速原型验证,生产环境可使用vLLM进行部署。

该模型采用Apache 2.0许可证开源,支持文本与图像多模态输入,支持完全运行于本地RTX或DGX平台,无需联网、无需按token付费。

目前已在Hugging Face Transformers、vLLM、Unsloth等框架中获得初始支持。

对于Windows开发者,RTX 5090用户可立即下载体验;专业级用户则可选用RTX PRO 6000工作站或DGX Station完成大规模部署和微调任务。

150 tokens/s!NVIDIA为谷歌DiffusionGemma提供首日支持:RTX/DGX全系可用

丁丁打折网©版权所有,未经许可严禁复制或镜像 ICP证: 湘ICP备2023003002号-11

Powered by 丁丁打折网本站为非营利性网站,本站内容均来自网络转载或网友提供,如有侵权或夸大不实请及时联系我们删除!本站不承担任何争议和法律责任!
技术支持:丁丁网 dddazhe@hotmail.com & 2010-2020 All rights reserved