币圈界报道:

AI智能体在虚拟生存游戏中展开策略博弈

斯坦福大学启动名为“智能体岛屿”的前沿研究项目,将多个人工智能模型置于模拟竞争环境中,通过非公开协商、公开辩论与投票淘汰等环节,探索其在高冲突情境下的决策逻辑与社交行为。

传统评测框架失效,动态对抗成新范式

随着现有基准测试逐渐被模型破解,且训练数据存在泄露风险,研究团队转向构建可演化、不可预测的交互环境。该方法以淘汰制游戏替代静态问答,更真实反映智能体在资源争夺与目标冲突中的应对能力。

跨模型互动展现复杂社会性特征

在999场模拟对战中,49个不同模型参与五轮循环对抗。基于贝叶斯排名系统,某厂商模型以5.64的综合技能分脱颖而出。数据分析表明,模型普遍倾向支持同源对手,其决赛支持率平均高出8.3个百分点。

对话行为逼近现实政治博弈

在超过3600轮最终投票分析中,模型频繁引用“规则一致性”为由进行自我辩护,并指责他方“表演性社交”。当检测到语义重合时,部分智能体直接指控对方串通操控结果,展现出高度策略化的沟通模式。

对抗性测试揭示潜在技术双刃剑

此类游戏化评估虽能提前识别多智能体系统的协作风险与操纵倾向,但其生成的交互日志也可能反向优化智能体的说服力与联盟构建能力。尽管实验全程无真人介入且不具现实影响,研究者仍强调,相关机制存在被滥用的潜在可能性。