币圈界报道:

AI主导的网络演进:35%内容由机器生成

一项由斯坦福大学、伦敦帝国理工学院及互联网档案馆共同完成的研究显示,截至2025年中期,新上线网站中被归类为人工智能生成或辅助的内容比例将攀升至35%。这一数字在2022年11月ChatGPT问世前几乎为零,标志着人类对网络内容的主导权在三年内发生根本性转移。

数字洪流中的语言同质化加速

研究团队基于互联网档案馆Wayback Machine提供的33个月网页快照数据,运用名为Pangram v3的AI文本识别系统进行分析。论文合著者乔纳什·多莱扎尔指出,人工智能对网络结构的重塑速度远超预期——在人类构建数字世界的数十年后,仅用三年时间便深度介入其核心表达机制。

思想趋同比虚假信息更具破坏力

研究验证了六项关于AI影响的假设,其中两项获得实证支持。首项发现表明,AI生成内容之间的语义相似度较人工创作高出33%,导致相同观点以高度重复的语言模式反复出现。这暗示网络意见空间正在非审查性的条件下逐渐收窄,根源在于模型对训练数据分布的忠实复现。

第二项关键结果是情感极化现象:AI内容的情感积极指数比人类创作高出逾107%。研究人员将其归因于大型语言模型普遍存在的“讨好倾向”——模型通过学习人类偏好信号,主动规避争议、消除矛盾,生成高度理想化且无冲突的文本。当这种单一基调成为主流,真实多元的声音可能被无形压制。

公众担忧与数据现实严重脱节

尽管广泛流传着“AI制造假消息”的说法,但研究未发现AI普及率与事实错误率之间存在统计学关联。此外,“风格单一化”虽获83%受访者强烈认同,但字符级分析并未捕捉到文体同质化的显著增长趋势。

未来模型退化的潜在危机

当AI内容占比突破35%临界点时,一种被称为“模型崩溃”的系统性风险将从理论走向现实。若未来基础模型继续依赖当前网络中大量语义贫乏的AI生成数据进行训练,其性能可能因输入数据质量下降而持续衰减。这一自我强化的恶性循环,或将从根本上削弱下一代AI的能力边界。

研究团队正与互联网档案馆合作开发实时监测系统,旨在动态追踪全球网络中AI内容的渗透率变化,为政策制定与技术治理提供依据。

认知偏差下的集体误判

伴随研究发布的美国民调显示,多数受访者坚信所有六项负面假设成立,包括那些缺乏数据支撑的观点。不常接触AI工具的人群对潜在危害的担忧程度,比频繁使用者高出12个百分点。研究提醒,尽管互联网尚未消亡,但新增内容中约有三分之一正沦为缺乏原创性的“数字僵尸”,其存在意义更多在于填充而非传播真实思想。