摘要:Sahara AI与微软联合发布高精度数据标注服务及开源评测基准MATHVISTA,旨在全面检验GPT-4V、Claude、Gemini等前沿多模态模型在真实场景中的表现,目前已获超27万次下载,技术方案被全球顶尖机构广泛采纳。

Sahara AI与微软共建多模态模型评估体系,推出MATHVISTA开源基准
为提升大模型在复杂现实情境下的推理与决策能力评估标准,Sahara AI与微软达成战略合作,共同推出高精度数据标注服务与开源评测基准MATHVISTA,该平台聚焦真实世界任务挑战,已吸引超过27万次下载,成为行业关键参考工具。
核心评估框架获多方验证,推动技术标准化进程
其构建的智能体驱动数据标注体系及动态评测机制,已成功应用于微软、亚马逊、Snap以及麻省理工学院等机构的研发流程中,显著提升模型训练效率与评估透明度。
声明:本站所有文章内容,均为采集网络资源,不代表本站观点及立场,不构成任何投资建议!如若内容侵犯了原著者的合法权益,可联系本站删除。
