首页
情报
装备
百科
精选
快讯
AI
猫咪范
首页
情报
装备
百科
精选
快讯
AI
猫咪范
注册
登录
推荐类别
栏目分类
开源软件
>
在线工具
开源软件
电脑软件
人工智能
>
3D
AI绘画
AI编程
AI视频
AI音频
ChatGPT
大语言模型
数字人
机器人
电脑游戏
>
chinaplay.store
Discord
Epic Games
Fanatical
GameSessions
giveaway
GMG
GOG
HumbleBundle
indiegala
IO游戏
itch.io
Microsoft Store
Origin
Rockstar Games Launcher
STEAM
Uplay
Wegame
Windows
战网
方块游戏
杉果游戏
主机游戏
>
任天堂Switch
微软Xbox
索尼PlayStation
手机游戏
>
IOS
taptap
安卓
MAD-Bench
优惠
基准测试MAD-Bench:系统地检验多模态大语言模型在面对文本提示和图像不一致时的冲突解决能力
AI
推荐人:暴走AI
标签:
MAD-Bench
多模态大语言模型
AI
2年前 (2024-02-21)AI
关于评估多模态大语言模型(MLLMs)在处理欺骗性提示(deceptive prompts)时的脆弱性,来自苹果的研究人员创建了一个名为MAD-Bench的基准测试,它包含了850个测试样本,分为六个类别,如不存在的对象、对象数量、空间关系和视觉混淆等,用以系统地检验MLLMs在面对文本提示和图像不一致时的冲突解决能力...
阅读全文
直达链接
好
0
不好
0
0
基准测试MAD-Bench:系统地检验多模态大语言模型在面对文本提示和图像不一致时的冲突解决能力
已关闭评论
热门
FNCTOD:利用大语言模型(LLMs)来实现零样本(zero-shot)对话状态跟踪(DST)
(656℃)
微软官方出品「微软电脑管家 v1.1」测试版发布,拥有微软全球防护系统
(866℃)
匿名电子邮件转寄服务「AnonAddy」,保护真实身份并强化隐私
(813℃)
黑曜石娱乐新作《禁闭求生》将于7月29日展开抢先体验,操作迷你主角在后院展开大冒险
(1153℃)
文字冒险游戏《极限脱出》系列,价格永久下调!
(1057℃)
《牧场物语 重聚矿石镇》繁体中文版登陆Switch平台,重温幸福的牧场生活
(1450℃)
我要爆料
我的收藏
顶部
快速登录
账户:
密码:
验证码:3 + 4 =
自动登录
忘记密码?
QQ登录
微博登录
注 册