英伟达推多模态智能体核心模型：Nemotron 3 Nano Omni上线

币圈界 2026-04-29 19:28:15 区块链

摘要：英伟达发布全新推理AI模型Nemotron 3 Nano Omni，支持文本、图像与语音统一处理，具备高效架构与低成本部署优势，标志着其向智能体AI基础设施全面布局。

币圈界报道：

英伟达推出多模态推理引擎Nemotron 3 Nano Omni，赋能下一代智能体应用

英伟达正式发布新一代推理型人工智能模型Nemotron 3 Nano Omni，该模型可同步解析文本、图像及语音输入，采用一体化架构实现跨模态信息融合，无需依赖独立识别组件。此举旨在为高性能、低延迟的智能体系统提供核心决策中枢。

统一架构驱动多源数据融合处理

新模型参数规模约300亿，采用混合专家机制，在保障响应速度的同时维持高度适应性。通过集成视觉-音频编码器与30B-3B混合专家结构，其可在单一框架内处理文档、屏幕画面、语音活动及视频流等多种输入形式。

公司披露，该模型在大规模部署场景中效率显著提升，处理速度相较当前主流开源多模态系统最高可达9倍。在对屏幕内容实时解析要求极高的智能体任务中表现尤为突出。一位高管表示：“构建真正可用的智能体，关键在于能否毫秒级理解界面状态。借助Nemotron 3 Nano Omni，即便是全高清屏幕录制也能即时分析，让过去难以实现的操作变为现实。”

轻量化设计兼顾成本控制与弹性扩展

该模型以紧凑体积著称，既可运行于高端消费级设备，亦可无缝部署于企业级云平台。同时支持与英伟达自有模型及其他Nemotron系列开放模型协同工作，例如高频操作调用“Nemotron 3 Super”，复杂策略生成则可联动更高阶模型进行组合式推理。

模型的核心定位是作为人与自动化系统之间的智能中介。它能够迅速将用户指令转化为综合推理流程，整合文档、音视频等多维信息，实现更接近自然对话的交互体验。这契合了行业从被动应答转向主动执行任务的智能体演进方向。

数据显示，Nemotron系列产品在过去一年累计下载量已突破5000万次。此次“Omni”版本的发布，意味着产品线由原有的Ultra、Super、Nano系列延伸至涵盖多模态感知与任务执行能力的智能体生态。

目前，该模型已通过英伟达NIM微服务形式在多个开发平台上线。作为轻量级开放模型，开发者既可本地部署，也可在DGX Spark等硬件平台上直接构建和应用。

此次发布反映出AI竞争焦点正从单纯追求模型规模转向构建更快、更实用的推理系统。英伟达正逐步超越传统芯片厂商角色，全面切入智能体时代所需的底层基础设施供应体系。

声明：本站所有文章内容，均为采集网络资源，不代表本站观点及立场，不构成任何投资建议！如若内容侵犯了原著者的合法权益，可联系本站删除。

₿

币安 Binance

币安交易所是全球加密货币交易所,注册奖励 500 U

官网注册下载APP

英伟达推多模态智能体核心模型：Nemotron 3 Nano Omni上线

币圈界报道：

英伟达推出多模态推理引擎Nemotron 3 Nano Omni，赋能下一代智能体应用

统一架构驱动多源数据融合处理

轻量化设计兼顾成本控制与弹性扩展

相关推荐