3月12日消息,继2024年发布两款Gemini开源模型后,谷歌于当地时间周二正式推出Gemma 3系列模型。
谷歌表示,这些模型旨在帮助开发者创建能够在任何地方运行的AI应用程序,无论是在手机还是工作站上。该系列模型支持超过35种语言,具有“先进的文本和视觉推理能力”,能够分析文本、图像和短视频。
Gemma 3“基于驱动Gemini 2.0模型的相同研究和技术”,目前提供Gemma 3-1B、Gemma 3-4B、Gemma 3-12B和Gemma 3-27B四种版本。此外,它们拥有128k的上下文窗口。
谷歌声称,Gemma 3是“世界上最强的单卡模型”,在采用单颗H100 GPU的主机上,它的性能超越了Meta Llama-405B、DeepSeek-V3以及OpenAI o3-mini 等竞争对手,同时针对英伟达GPU和专用AI硬件进行了优化。
Gemma 3的视觉编码器也得到升级,支持高分辨率和非方形图像。而新的ShieldGemma 2图像安全分类器,则可用于过滤图像输入和输出中的色情、危险或暴力内容。
在聊天机器人领域的ELO得分排名中,Gemma排在第二位,但它仅需要单颗英伟达H100 GPU即可运行
2024年,对于像Gemma这样的小尺寸模型是否会受到市场欢迎还存在不确定性,但DeepSeek等模型的崛起表明,具备较低硬件要求的AI技术确实有市场需求。
尽管谷歌宣称其AI技术功能强大,但也提到,“Gemma 3在增强STEM表现后,专门进行了潜在滥用风险评估,结果显示其风险较低”。
谷歌还通过提供Google Cloud信用额度来推广Gemma。此外,Gemma 3学术计划将允许学术研究人员申请最高10,000美元的信用额度,以加速他们的研究工作。(腾讯科技特约编译金鹿)