谷歌发布Gemma 4:多模态能力跃升,支持跨模态交互

4月3日,谷歌正式发布其最新一代多模态模型Gemma 4,该模型具备处理文本、图像输入及生成文本输出的能力,小型版本更支持音频数据处理。作为开源权重模型,Gemma 4包含预训练与指令调优两个版本,便于开发者灵活应用。

超大上下文窗口支撑复杂任务,覆盖140多种语言

Gemma 4配备高达25.6万个token的上下文容量,显著提升长文本理解与生成效率,同时支持超过140种语言的跨语言处理,满足全球化应用场景需求。

双架构并行设计,适配多样化计算环境

该模型融合密集型架构与混合专家(MoE)机制,在文本生成、代码编写及逻辑推理等任务中表现优异。提供E2B、E4B、26B A4B和31B四种规格,可无缝部署于智能手机、笔记本电脑乃至数据中心级服务器。