摘要:英伟达发布全新推理AI模型Nemotron 3 Nano Omni,支持文本、图像与语音统一处理,具备高效架构与低成本部署优势,标志着其向智能体AI基础设施全面布局。

币圈界报道:
英伟达推出多模态推理引擎Nemotron 3 Nano Omni,赋能下一代智能体应用
英伟达正式发布新一代推理型人工智能模型Nemotron 3 Nano Omni,该模型可同步解析文本、图像及语音输入,采用一体化架构实现跨模态信息融合,无需依赖独立识别组件。此举旨在为高性能、低延迟的智能体系统提供核心决策中枢。
统一架构驱动多源数据融合处理
新模型参数规模约300亿,采用混合专家机制,在保障响应速度的同时维持高度适应性。通过集成视觉-音频编码器与30B-3B混合专家结构,其可在单一框架内处理文档、屏幕画面、语音活动及视频流等多种输入形式。
公司披露,该模型在大规模部署场景中效率显著提升,处理速度相较当前主流开源多模态系统最高可达9倍。在对屏幕内容实时解析要求极高的智能体任务中表现尤为突出。一位高管表示:“构建真正可用的智能体,关键在于能否毫秒级理解界面状态。借助Nemotron 3 Nano Omni,即便是全高清屏幕录制也能即时分析,让过去难以实现的操作变为现实。”
轻量化设计兼顾成本控制与弹性扩展
该模型以紧凑体积著称,既可运行于高端消费级设备,亦可无缝部署于企业级云平台。同时支持与英伟达自有模型及其他Nemotron系列开放模型协同工作,例如高频操作调用“Nemotron 3 Super”,复杂策略生成则可联动更高阶模型进行组合式推理。
模型的核心定位是作为人与自动化系统之间的智能中介。它能够迅速将用户指令转化为综合推理流程,整合文档、音视频等多维信息,实现更接近自然对话的交互体验。这契合了行业从被动应答转向主动执行任务的智能体演进方向。
数据显示,Nemotron系列产品在过去一年累计下载量已突破5000万次。此次“Omni”版本的发布,意味着产品线由原有的Ultra、Super、Nano系列延伸至涵盖多模态感知与任务执行能力的智能体生态。
目前,该模型已通过英伟达NIM微服务形式在多个开发平台上线。作为轻量级开放模型,开发者既可本地部署,也可在DGX Spark等硬件平台上直接构建和应用。
此次发布反映出AI竞争焦点正从单纯追求模型规模转向构建更快、更实用的推理系统。英伟达正逐步超越传统芯片厂商角色,全面切入智能体时代所需的底层基础设施供应体系。
声明:本站所有文章内容,均为采集网络资源,不代表本站观点及立场,不构成任何投资建议!如若内容侵犯了原著者的合法权益,可联系本站删除。
