WE-MATH - 猎游人

栏目分类

$基准测试WE-MATH：专门用来评估这些模型在解决视觉数学问题时所遵循的解题原则$

推荐人：暴走AI 标签：WE-MATH AI

2年前 (2024-07-02)AI

北京邮电大学、腾讯、华中科技大学和北京技术研究院的研究人员推出基准测试WE-MATH，测试大型多模态模型（Large Multimodal Models，简称LMMs）在进行数学推理时是否能达到类似人类的水平，专门用来评估这些模型在 ...... 阅读全文

推荐类别