谷歌发布Gemini API预览版支持Flash Lite模型
谷歌近日宣布,其3.1 Flash Lite模型已通过Gemini API在Google AI Studio正式上线预览版本,面向全球开发者开放接入。该模型以低延迟、高吞吐为特点,适用于需要快速响应的轻量级应用。用户可按使用量计费,输入令牌定价为每100万个0.25美元,输出令牌则为每100万个1.50美元。企业客户可通过Vertex AI获取服务
除开发者平台外,该模型也同步面向企业客户在Vertex AI环境中提供支持。此举旨在满足企业对高效推理能力的需求,提升在生产环境中的部署灵活性。目前,所有接入均处于预览阶段,后续将根据反馈优化性能与可用性。声明:本站所有文章内容,均为采集网络资源,不代表本站观点及立场,不构成任何投资建议!如若内容侵犯了原著者的合法权益,可联系本站删除。
