优惠 D-MERIT数据集：信息检索（IR）模型的评估方法

AI

推荐人：暴走AI 标签：D-MERIT数据集 AI

2年前 (2024-06-25)AI

亚马逊研究院、巴伊兰大学和艾伦人工智能研究所推出D-MERIT数据集，关于信息检索（Information Retrieval，简称IR）模型的评估方法。信息检索模型的任务是在一个大型的文档集合中，根据用户提出的查询（query），找 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠评估基准BigCodeBench：用来测试大型编程语言模型在代码生成方面的能力

AI

推荐人：暴走AI 标签：BigCodeBench AI

2年前 (2024-06-25)AI

评估基准BigCodeBench，它专门用来测试大型编程语言模型（LLMs）在代码生成方面的能力。这个基准通过设计具有多种功能调用和复杂指令的编程任务，来挑战和评估这些模型是否能够像人类开发者一样解决实际的编程问题。 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠开源项目reveal-md：允许用户使用 Markdown 编写演示文稿，并通过 reveal.js 框架将其转换为 HTML 格式

工具

推荐人：暴走AI 标签：reveal-md 工具

2年前 (2024-06-25)工具

reveal-md 是一个开源项目，它允许用户使用 Markdown 编写演示文稿，并通过 reveal.js 框架将其转换为 HTML 格式，从而在浏览器中进行展示。该项目在 GitHub 上的标星数量达到了 2.1K，表明其在开发者中有一定的受欢 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠全面基准测试工具VideoHallucer：专门用来检测和评估LVLMs在视频理解任务中的幻觉问题

AI

推荐人：暴走AI 标签：VideoHallucer 幻觉 AI

2年前 (2024-06-25)AI

北京通用人工智能研究院、通用人工智能国家重点实验室、北京大学和加州大学圣克鲁斯分校推出全面基准测试工具VideoHallucer，专门用来检测和评估LVLMs在视频理解任务中的幻觉问题。所谓“幻觉”，指的是这些模型在理解 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠多模态模型LongVA:更好地理解和处理非常长的视频序列

AI

推荐人：暴走AI 标签：LongVA 多模态模型 AI

2年前 (2024-06-25)AI

LMMs 实验室团队、新加坡南洋理工大学和新加坡科技大学的研究人员推出Long Video Assistant（LongVA）模型，让大型多模态模型（LMMs）更好地理解和处理非常长的视频序列。这里的“长视频”指的是视频帧数很多，可能达 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 4K4DGen：将静态全景图像转换成4K分辨率的4D（即具有时间和空间维度）动态场景

AI

推荐人：暴走AI 标签：4K4DGen AI

2年前 (2024-06-24)AI

Pico、德克萨斯大学奥斯汀分校和加州大学洛杉矶分校的研究人员推出4K4DGen，它能够将静态全景图像转换成4K分辨率的4D（即具有时间和空间维度）动态场景。这项技术对于虚拟现实（VR）和增强现实（AR）应用来说是一个 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新方法ToVo：通过投票机制和思维链过程来创建一个开源的、高质量的数据集，用于检测和分类有害内容

AI

推荐人：暴走AI 标签：ToVo AI

2年前 (2024-06-24)AI

新方法ToVo（Toxicity Taxonomy via Voting），它旨在通过投票机制和思维链（Chain-of-Thought）过程来创建一个开源的、高质量的数据集，用于检测和分类有害内容（toxic content）。这种方法特别关注提高现有有害内 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠一种新的机器翻译方法MeritFed：基于个性化联邦学习算法，专门针对低资源语言的翻译任务

AI

推荐人：暴走AI 标签：MeritFed AI

2年前 (2024-06-24)AI

一种新的机器翻译方法MeritFed，它基于个性化联邦学习（Personalized Federated Learning）算法，专门针对低资源语言（Low-Resource Languages，简称LRLs）的翻译任务。低资源语言通常缺乏足够的数据来训练高效的机 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MMFM-Challenge：用于改进多模态基础模型（MMFMs）在特定任务上的表现，尤其是文档理解方面

AI

推荐人：暴走AI 标签：MMFM-Challenge AI

2年前 (2024-06-24)AI

新框架“多模态结构化生成”（Multimodal Structured Generation），它用于改进多模态基础模型（Multimodal Foundation Models，简称MMFMs）在特定任务上的表现，尤其是文档理解方面。MMFMs是结合了不同模态（如视觉和 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠用于自动驾驶车辆模拟和基准测试的数据驱动工具NAVSIM

AI

推荐人：暴走AI 标签：NAVSIM AI

2年前 (2024-06-24)AI

新框架NAVSIM是一个用于自动驾驶车辆模拟和基准测试的数据驱动工具。NAVSIM特别关注于评估基于视觉的驾驶策略，这些策略试图让自动驾驶车辆能够理解和响应它们周围的世界。NAVSIM在CVPR 2024上举办的一个竞赛，吸引 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠改进信息检索（IR）的方法RE-AdaptIR：通过逆向工程适应来提升信息检索的效果

AI

推荐人：暴走AI 标签：RE-AdaptIR AI

2年前 (2024-06-24)AI

约翰霍普金斯大学的研究人员推出一种改进信息检索（IR）的方法，称为"RE-AdaptIR"，即通过逆向工程适应（Reverse Engineered Adaptation）来提升信息检索的效果。这种方法特别适用于大型语言模型（LLMs），这些模型 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠自动视频质量评估工具MANTISSCORE：自动评估视频生成的质量

AI

推荐人：暴走AI 标签：MANTISSCORE AI

2年前 (2024-06-24)AI

滑铁卢大学、清华大学、Stardust.AI、多伦多大学和AI2的研究人员推出自动视频质量评估工具MANTISSCORE，自动评估视频生成的质量。随着人工智能技术的发展，尤其是文本到视频（Text-to-Video, T2V）生成模型的快速进 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

推荐类别

栏目分类

优惠 D-MERIT数据集：信息检索（IR）模型的评估方法

优惠评估基准BigCodeBench：用来测试大型编程语言模型在代码生成方面的能力

优惠开源项目reveal-md：允许用户使用 Markdown 编写演示文稿，并通过 reveal.js 框架将其转换为 HTML 格式

优惠全面基准测试工具VideoHallucer：专门用来检测和评估LVLMs在视频理解任务中的幻觉问题

优惠多模态模型LongVA:更好地理解和处理非常长的视频序列

优惠 4K4DGen：将静态全景图像转换成4K分辨率的4D（即具有时间和空间维度）动态场景

优惠新方法ToVo：通过投票机制和思维链过程来创建一个开源的、高质量的数据集，用于检测和分类有害内容

优惠一种新的机器翻译方法MeritFed：基于个性化联邦学习算法，专门针对低资源语言的翻译任务

优惠 MMFM-Challenge：用于改进多模态基础模型（MMFMs）在特定任务上的表现，尤其是文档理解方面

优惠用于自动驾驶车辆模拟和基准测试的数据驱动工具NAVSIM

优惠改进信息检索（IR）的方法RE-AdaptIR：通过逆向工程适应来提升信息检索的效果

优惠自动视频质量评估工具MANTISSCORE：自动评估视频生成的质量