【太平洋科技快讯】5月21日,在2025年谷歌I/O开发者大会上,谷歌正式推出了一款端侧多模态AI模型——Gemma 3n。该模型专为资源受限的设备设计,仅需2GB即可在、平板和上本地运行,支持处理音频、文本、图片和视频等多种数据类型。
Gemma 3n基于Gemini Nano架构,其最大亮点在于采用了谷歌DeepMind开发的Per-Layer Embeddings(PLE)技术,这项技术显著降低了模型的内存需求。尽管Gemma 3n的参数量高达5B和8B,但其内存占用仅相当于2B和4B模型,使得在内存小于2GB的设备上运行成为可能。Gemma 3n产品经理Gus Martins表示:“Gemma 3n为设备端AI应用带来了惊人的表现力。”
除了PLE技术,Gemma 3n还集成了KVC共享和高级激活量化等技术,进一步优化了内存和计算效率。这些技术的应用使得Gemma 3n在移动设备上的响应速度提升了1.5倍,同时保持了优于Gemma 3 4B版本的质量表现。
Gemma 3n在非英语语言处理方面也取得了突破性进展,尤其在日语、德语、韩语、西班牙语和法语中表现优异。在多语言基准测试WMT24中,该模型得分高达50.1%,展现了其强大的多语言处理能力。
用户无需进行任何设置,即可通过Google AI Studio在浏览器中直接使用Gemma 3n。对于开发者而言,他们可以通过Google AI Edge将Gemma 3n的本地功能集成到自己的应用中,支持文本和图像的理解与生成。未来,Gemma 3n还将扩展更多能力,为开发者提供更强大的工具。
丁丁打折网©版权所有,未经许可严禁复制或镜像 ICP证: 湘ICP备20009233号-2
Powered by 丁丁打折网本站为非营利性网站,本站内容均来自网络转载或网友提供,如有侵权或夸大不实请及时联系我们删除!本站不承担任何争议和法律责任!
技术支持:丁丁网 dddazhe@hotmail.com & 2010-2020 All
rights reserved