推荐类别

栏目分类

MAD-Bench

优惠基准测试MAD-Bench：系统地检验多模态大语言模型在面对文本提示和图像不一致时的冲突解决能力

基准测试MAD-Bench：系统地检验多模态大语言模型在面对文本提示和图像不一致时的冲突解决能力

AI

推荐人：暴走AI 标签：MAD-Bench 多模态大语言模型 AI

2年前 (2024-02-21)AI

关于评估多模态大语言模型（MLLMs）在处理欺骗性提示（deceptive prompts）时的脆弱性，来自苹果的研究人员创建了一个名为MAD-Bench的基准测试，它包含了850个测试样本，分为六个类别，如不存在的对象、对象数量、空 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

我要爆料我的收藏顶部

© Copyright2019-2026 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录