Sahara AI与微软共建多模态模型评估体系,推出MATHVISTA开源基准

为提升大模型在复杂现实情境下的推理与决策能力评估标准,Sahara AI与微软达成战略合作,共同推出高精度数据标注服务与开源评测基准MATHVISTA,该平台聚焦真实世界任务挑战,已吸引超过27万次下载,成为行业关键参考工具。

核心评估框架获多方验证,推动技术标准化进程

其构建的智能体驱动数据标注体系及动态评测机制,已成功应用于微软、亚马逊、Snap以及麻省理工学院等机构的研发流程中,显著提升模型训练效率与评估透明度。