币圈界报道:

银博士重申:强化学习是通向超智能的必由之路

在阿尔法围棋击败李世石引发全球关注后,DeepMind核心成员David Silver已启动新项目,其创立的初创公司Ineffable Intelligence以51亿美元估值正式启航。他明确指出,未来人工智能的跃迁不会来自当前主导的大语言模型,而将依赖于一种基于试错与自我演进的训练机制。

自主经验驱动系统或成智能跃升关键

Silver强调,当前大模型受限于人类生成数据的静态特性,难以突破认知边界。相较之下,强化学习构建的智能体可在仿真环境中持续迭代,通过目标导向行为积累真实经验,从而具备发现新科学规律与社会形态的能力。

超越数据依赖:从化石燃料到可再生能源

他将人类训练数据比作“化石燃料”,虽高效却终将耗尽;而自主学习系统则如“可再生能源”,能无限扩展认知疆域。若在普遍相信地平说的环境中训练模型,系统可能延续错误信念,但基于经验的智能体则可能主动推翻谬误,实现认知重构。

构建新型智能实验室:专注自主进化路径

Silver主张建立独立于大模型机构的顶尖研究实体,专注于培育“超级学习者”。这些系统将在复杂模拟世界中不断尝试、失败、优化,逐步发展出协作与自组织能力,最终逼近具有广泛适应性的通用智能形态。