优惠 AUTOHALLUSION：为视觉-语言模型自动生成幻觉基准测试

推荐人：暴走AI 标签：AUTOHALLUSION 视觉-语言模型 AI

2年前 (2024-06-29)AI

马里兰大学帕克分校的研究人员推出AUTOHALLUSION，这是一种为视觉-语言模型（Vision-Language Models，简称LVLMs）自动生成幻觉基准测试的方法。简单来说，LVLMs是一种人工智能，它们可以同时处理图像和语言信息，比 ...... 阅读全文

优惠新型视觉-语言模型BRAVE：扩展和增强VLM在处理图像和语言任务时的视觉编码能力

推荐人：暴走AI 标签：BRAVE 视觉-语言模型 AI

2年前 (2024-04-11)AI

谷歌和洛桑瑞士联邦理工学院推出新型视觉-语言模型BRAVE，它的核心目标是扩展和增强VLM在处理图像和语言任务时的视觉编码能力。想象一下，如果你给BRAVE一个描述，比如“一只蝴蝶停在花上”，它不仅能够理解这个描述， ...... 阅读全文

推荐人：暴走AI 标签：视觉-语言模型 AI

2年前 (2024-03-09)AI

来自苹果的研究人员发布论文探讨了视觉-语言模型（VLMs）在视觉推理任务上的表现，特别是针对一种名为雷文进阶矩阵（Raven's Progressive Matrices，简称RPMs）的智力测试。RPMs是一种经典的智力测试工具，它要求参 ...... 阅读全文

推荐人：暴走AI 标签：CLoVe 视觉-语言模型 AI

2年前 (2024-02-26)AI

密歇根大学安娜堡分校、Netflix的研究人员发布论文介绍了一个名为CLoVe（Contrastive Language-Image Vision Models）的框架，旨在提高现有的视觉-语言模型（VLMs）在处理组合语言时的能力。VLMs，如CLIP模型，通常 ...... 阅读全文