推荐类别

栏目分类

优惠 D-MERIT数据集:信息检索(IR)模型的评估方法

  • D-MERIT数据集:信息检索(IR)模型的评估方法
    AI
  • 亚马逊研究院、巴伊兰大学和艾伦人工智能研究所推出D-MERIT数据集,关于信息检索(Information Retrieval,简称IR)模型的评估方法。信息检索模型的任务是在一个大型的文档集合中,根据用户提出的查询(query),找出与之相关的文档段落(passages)。这就像我们在互联网上搜索信息时,搜索引擎会返... 阅读全文

    优惠 评估基准BigCodeBench:用来测试大型编程语言模型在代码生成方面的能力

  • 评估基准BigCodeBench:用来测试大型编程语言模型在代码生成方面的能力
    AI
  • 评估基准BigCodeBench,它专门用来测试大型编程语言模型(LLMs)在代码生成方面的能力。这个基准通过设计具有多种功能调用和复杂指令的编程任务,来挑战和评估这些模型是否能够像人类开发者一样解决实际的编程问题。通过这种评估,研究人员和开发人员可以更好地理解LLMs在编程任务中的表现,以及它们在实际应用中的潜力和局... 阅读全文

    优惠 开源项目reveal-md:允许用户使用 Markdown 编写演示文稿,并通过 reveal.js 框架将其转换为 HTML 格式

  • 开源项目reveal-md:允许用户使用 Markdown 编写演示文稿,并通过 reveal.js 框架将其转换为 HTML 格式
    工具
  • reveal-md 是一个开源项目,它允许用户使用 Markdown 编写演示文稿,并通过 reveal.js 框架将其转换为 HTML 格式,从而在浏览器中进行展示。该项目在 GitHub 上的标星数量达到了 2.1K,表明其在开发者中有一定的受欢迎程度。 安装和使用 安装 reveal-md 相对简单,仅需确保已经... 阅读全文

    优惠 全面基准测试工具VideoHallucer:专门用来检测和评估LVLMs在视频理解任务中的幻觉问题

  • 全面基准测试工具VideoHallucer:专门用来检测和评估LVLMs在视频理解任务中的幻觉问题
    AI
  • 北京通用人工智能研究院、通用人工智能国家重点实验室、北京大学和加州大学圣克鲁斯分校推出全面基准测试工具VideoHallucer,专门用来检测和评估LVLMs在视频理解任务中的幻觉问题。所谓“幻觉”,指的是这些模型在理解视频内容时,可能会生成与实际视频内容不符、无关或无意义的信息,这种现象可能会误导用户。VideoHa... 阅读全文

    优惠 多模态模型LongVA:更好地理解和处理非常长的视频序列

  • 多模态模型LongVA:更好地理解和处理非常长的视频序列
    AI
  • LMMs 实验室团队、 新加坡南洋理工大学和新加坡科技大学的研究人员推出Long Video Assistant(LongVA)模型,让大型多模态模型(LMMs)更好地理解和处理非常长的视频序列。这里的“长视频”指的是视频帧数很多,可能达到数千帧。以往的模型在处理这类视频时会遇到困难,因为它们的视觉编码器会产生大量的视... 阅读全文

    优惠 4K4DGen:将静态全景图像转换成4K分辨率的4D(即具有时间和空间维度)动态场景

  • 4K4DGen:将静态全景图像转换成4K分辨率的4D(即具有时间和空间维度)动态场景
    AI
  • Pico、德克萨斯大学奥斯汀分校和加州大学洛杉矶分校的研究人员推出4K4DGen,它能够将静态全景图像转换成4K分辨率的4D(即具有时间和空间维度)动态场景。这项技术对于虚拟现实(VR)和增强现实(AR)应用来说是一个巨大的突破,因为它提供了一种新的方式来创造沉浸式和动态的环境。目前4K4DGen的局限性,比如当前技术... 阅读全文

    优惠 新方法ToVo:通过投票机制和思维链过程来创建一个开源的、高质量的数据集,用于检测和分类有害内容

  • 新方法ToVo:通过投票机制和思维链过程来创建一个开源的、高质量的数据集,用于检测和分类有害内容
    AI
  • 新方法ToVo(Toxicity Taxonomy via Voting),它旨在通过投票机制和思维链(Chain-of-Thought)过程来创建一个开源的、高质量的数据集,用于检测和分类有害内容(toxic content)。这种方法特别关注提高现有有害内容检测模型的透明度、可定制性和可复现性。论文还讨论了ToVo... 阅读全文

    优惠 一种新的机器翻译方法MeritFed:基于个性化联邦学习算法,专门针对低资源语言的翻译任务

  • 一种新的机器翻译方法MeritFed:基于个性化联邦学习算法,专门针对低资源语言的翻译任务
    AI
  • 一种新的机器翻译方法MeritFed,它基于个性化联邦学习(Personalized Federated Learning)算法,专门针对低资源语言(Low-Resource Languages,简称LRLs)的翻译任务。低资源语言通常缺乏足够的数据来训练高效的机器翻译模型。MeritFed算法的核心思想是,即使在不同... 阅读全文

    优惠 MMFM-Challenge:用于改进多模态基础模型(MMFMs)在特定任务上的表现,尤其是文档理解方面

  • MMFM-Challenge:用于改进多模态基础模型(MMFMs)在特定任务上的表现,尤其是文档理解方面
    AI
  • 新框架“多模态结构化生成”(Multimodal Structured Generation),它用于改进多模态基础模型(Multimodal Foundation Models,简称MMFMs)在特定任务上的表现,尤其是文档理解方面。MMFMs是结合了不同模态(如视觉和语言)的预训练基础模型,虽然在多种任务上表现出色... 阅读全文

    优惠 用于自动驾驶车辆模拟和基准测试的数据驱动工具NAVSIM

  • 用于自动驾驶车辆模拟和基准测试的数据驱动工具NAVSIM
    AI
  • 新框架NAVSIM是一个用于自动驾驶车辆模拟和基准测试的数据驱动工具。NAVSIM特别关注于评估基于视觉的驾驶策略,这些策略试图让自动驾驶车辆能够理解和响应它们周围的世界。NAVSIM在CVPR 2024上举办的一个竞赛,吸引了来自世界各地的团队提交了多种方法,展示了NAVSIM在推动自动驾驶研究方面的潜力。此外,论文... 阅读全文

    优惠 改进信息检索(IR)的方法RE-AdaptIR:通过逆向工程适应来提升信息检索的效果

  • 改进信息检索(IR)的方法RE-AdaptIR:通过逆向工程适应来提升信息检索的效果
    AI
  • 约翰霍普金斯大学的研究人员推出一种改进信息检索(IR)的方法,称为"RE-AdaptIR",即通过逆向工程适应(Reverse Engineered Adaptation)来提升信息检索的效果。这种方法特别适用于大型语言模型(LLMs),这些模型在经过微调后能够在多个信息检索基准测试中取得最先进的结果。但问题是,这种监... 阅读全文

    优惠 自动视频质量评估工具MANTISSCORE:自动评估视频生成的质量

  • 自动视频质量评估工具MANTISSCORE:自动评估视频生成的质量
    AI
  • 滑铁卢大学、清华大学、Stardust.AI、多伦多大学和AI2的研究人员推出自动视频质量评估工具MANTISSCORE,自动评估视频生成的质量。随着人工智能技术的发展,尤其是文本到视频(Text-to-Video, T2V)生成模型的快速进步,我们需要一种可靠的方法来评估这些由AI生成的视频的质量。但是,现有的评估指... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?