摘要:斯坦福主导的研究显示,法学教授在盲审中更青睐AI生成的法律答案,尤其在推理深度与内容安全方面表现突出。研究揭示AI在法律教学中的潜力与局限。

币圈界报道:
AI生成法律解答获法学专家广泛认可
一项由斯坦福大学牵头的跨校研究发现,在法律推理任务中,16位来自全美顶尖法学院的教授更倾向于采纳人工智能生成的答案,而非同行撰写的文本。研究设计涵盖40道合同法相关问题,覆盖学说阐释、判例分析、假设推演与政策权衡等多维度议题,旨在评估AI在复杂判断型任务中的实际表现。
盲评机制验证模型输出接受度
研究采用2918次双盲对比评估,要求教授在人类教师与AI生成答案间选择更适合作为教学范本者。结果显示,谷歌Gemini 2.5 Pro以75.92%的胜率领先,NotebookLM紧随其后,达74.75%。整体上,约75%的评价场景中,人工智能产出获得更高认可。研究团队指出,该结果超越了随机判断水平,表明模型输出与法学界通用标准高度契合。
多维评估揭示生成内容深层优势
为区分表层文风与实质质量,研究构建包含答案长度、结构逻辑、推理精细度、法源引用准确度、表述确信程度及教学适用性在内的综合评估体系。分析表明,人工智能在案例回溯、规范援引与政策讨论等关键环节均展现优于人类教师的系统性表现。此外,内容安全性方面,AI生成内容被标记为有害的比例显著更低——Gemini为3.41%,NotebookLM为3.64%,而人类教师高达12.06%。
技术效能与实践边界并存
尽管整体表现优异,研究亦指出当前框架无法衡量答案是否符合个体教师的教学偏好。报告强调:“虽然多数情况下AI回应更受青睐,但其价值可能仅限于‘足够好’的标准方案,而非个性化教学需求的精准匹配。”同时,行业正加速整合,洛杉矶高等法院已启动AI辅助案件处理试点,多所法学院增设人工智能课程。密西西比大学法学院院长表示,未来从业者必须掌握此类工具,否则将难以满足雇主期待。然而,虚假引注等“幻觉”风险仍存,四月某国际律所因提交含虚构判例的文件遭公开承认,凸显技术监管机制亟待健全。
声明:本站所有文章内容,均为采集网络资源,不代表本站观点及立场,不构成任何投资建议!如若内容侵犯了原著者的合法权益,可联系本站删除。
