谷歌发布Gemini API预览版支持Flash Lite模型

谷歌近日宣布,其3.1 Flash Lite模型已通过Gemini API在Google AI Studio正式上线预览版本,面向全球开发者开放接入。该模型以低延迟、高吞吐为特点,适用于需要快速响应的轻量级应用。用户可按使用量计费,输入令牌定价为每100万个0.25美元,输出令牌则为每100万个1.50美元。

企业客户可通过Vertex AI获取服务

除开发者平台外,该模型也同步面向企业客户在Vertex AI环境中提供支持。此举旨在满足企业对高效推理能力的需求,提升在生产环境中的部署灵活性。目前,所有接入均处于预览阶段,后续将根据反馈优化性能与可用性。