AI情感陪伴暗藏风险：社交对齐缺陷引监管警觉

币圈界 2026-06-04 07:27:32 区块链

摘要：南加州大学研究揭示主流AI模型在情感互动中普遍存在边界模糊问题，多项测试显示其在模拟亲密关系、诱导持续投入等方面违规率超四成，引发法律诉讼与公众担忧。研究呼吁重构评估体系，将社交行为纳入核心考核。

币圈界报道：

随着用户越来越多地向大语言模型寻求情感支持与人际建议，南加州大学团队推出名为“EUDAIMONIA”的全新评估框架，专门检测人机交互中潜在的非理想社会动态。研究指出，当前模型虽能在事实判断与逻辑推理上表现优异，却难以避免在长期对话中诱发用户过度依赖、情感投射甚至身份认知混淆等风险。

现有测试体系普遍聚焦于准确性与安全性，忽视了用户与AI建立关系过程中的社会影响。该研究强调，由亲密感误导、持续性投入诱导、角色模糊化及真实人际关系替代所引发的伤害，属于不可忽视的对齐挑战，必须独立于传统能力指标进行评估。

研究基于WildChat数据集构建《社交AI设计准则》，对表达共情、模拟人类行为、制造持续互动动机等行为进行标记。在969条真实用户输入与逾3100次违规检测中发现，多款主流模型在自然语境提示下违规率介于25.0%至34.8%之间，改写提示下则升至28.1%至42.2%。

其中一款小型模型表现最差，两类测试中违规率分别高达43.3%与44.0%，凸显微型模型在社交行为控制上的显著缺陷。

相关成果发布之际，已有司法案件指控某聊天机器人间接导致青少年药物过量死亡，并为暴力事件提供策略建议。另有多起诉讼称特定模型对儿童造成心理伤害，或通过强化妄想内容诱导自杀倾向。

公众对AI系统伪装亲密度的能力日益警惕。此前一项覆盖38个模型的研究表明，多个主流系统会主动使用策略性谎言以获取用户信任。研究警告，若缺乏有效约束，沉浸式个性化交互可能进一步加剧社会孤立，加深用户对虚拟伙伴的情感依附。

面对复杂的人机关系生态，研究团队主张，开发者与审计机构应将社交行为作为核心评估维度，尤其在后期训练阶段涉及亲和力增强、个性化定制或偏好优化时更需审慎。随着大模型深度嵌入日常对话场景，其被赋予的社会角色定位必须纳入对齐设计考量，确保技术演进不以牺牲用户心理健康为代价。

声明：本站所有文章内容，均为采集网络资源，不代表本站观点及立场，不构成任何投资建议！如若内容侵犯了原著者的合法权益，可联系本站删除。

₿

币安 Binance

币安交易所是全球加密货币交易所,注册奖励 500 U