AI

优惠 全新的视觉数学问题解决基准测试MATHVERSE:评估多模态大语言模型在解决涉及图表的视觉数学问题时的表现

  • 全新的视觉数学问题解决基准测试MATHVERSE:评估多模态大语言模型在解决涉及图表的视觉数学问题时的表现
    AI
  • 来自香港中文大学、上海人工智能实验室和加州大学洛杉矶分校的研究人员推出MATHVERSE,这是一个全新的视觉数学问题解决基准测试,专门设计来评估多模态大型语言模型(MLLMs)在解决涉及图表的视觉数学问题时的表现。 ...... 阅读全文

    优惠 如何在生成性语言模型中为用户提供算法追索的机制

  • 如何在生成性语言模型中为用户提供算法追索的机制
    AI
  • 这篇论文探讨了如何在生成性语言模型(Generative Language Models,简称GLMs)中为用户提供算法追索(algorithmic recourse)的机制。所谓算法追索,指的是用户能够对模型的预测或输出进行改变的能力。在GLMs中,这 ...... 阅读全文

    优惠 多模态大语言模型Cobra:提高现有MLLM在处理视觉信息时的效率

  • 多模态大语言模型Cobra:提高现有MLLM在处理视觉信息时的效率
    AI
  • 谷歌发布论文介绍了一个名为Cobra的新型多模态大语言模型(MLLM)。Cobra的设计理念是为了提高现有MLLM在处理视觉信息时的效率。传统的MLLM通常基于Transformer网络结构,这种结构虽然强大,但计算复杂度是二次方的 ...... 阅读全文

    优惠 个性化视觉语言模型MyVLM:让预训练的VLM能够理解和处理用户特定的概念

  • 个性化视觉语言模型MyVLM:让预训练的VLM能够理解和处理用户特定的概念
    AI
  • 来自特拉维夫大学和SNAP的研究人员推出MyVLM,这是一种个性化视觉语言模型(Vision-Language Model,简称VLM)。MyVLM的目标是让预训练的VLM能够理解和处理用户特定的概念,例如识别图片中的特定人物或物品,并在生 ...... 阅读全文

    优惠 Adobe推出新型高保真立体声音码器MusicHiFi

  • Adobe推出新型高保真立体声音码器MusicHiFi
    AI
  • Adobe推出一个名为MusicHiFi的新型高保真立体声音码器(vocoder)。声音码器是一种可以将音乐的图像表示(例如梅尔频谱图)转换为音频波形的技术。现有的大多数声音码器通常只能生成较低分辨率的单声道音频(例如16- ...... 阅读全文

    优惠 Alignment Studio:帮助开发者将大语言模型调整到符合特定上下文规范,例如企业的价值观、社会规范、法律法规等

  • Alignment Studio:帮助开发者将大语言模型调整到符合特定上下文规范,例如企业的价值观、社会规范、法律法规等
    AI
  • 这篇论文介绍了一个名为“Alignment Studio”的系统,它旨在帮助开发者将大型语言模型(LLMs)调整到符合特定上下文规范,例如企业的价值观、社会规范、法律法规等。这个系统特别适用于那些需要根据特定情境调整AI行为 ...... 阅读全文

    优惠 Recurrent Drafter:提高大语言模型的解码效率

  • Recurrent Drafter:提高大语言模型的解码效率
    AI
  • 苹果发布论文介绍了一种名为“Recurrent Drafter”(简称ReDrafter)的新方法,旨在提高大语言模型(Large Language Models,简称LLMs)的解码效率。大型语言模型是人工智能领域的一种先进技术,它们通过学习大量文本 ...... 阅读全文

    优惠 如何评估和理解大语言模型(LLMs)中的奖励模型(Reward Models,简称RMs)

  • 如何评估和理解大语言模型(LLMs)中的奖励模型(Reward Models,简称RMs)
    AI
  • 这篇论文的主题是关于如何评估和理解大型语言模型(LLMs)中的奖励模型(Reward Models,简称RMs)。奖励模型在训练过程中扮演着至关重要的角色,它们通过人类反馈来引导模型学习如何更好地与人类价值观和偏好相一致 ...... 阅读全文

    优惠 Meta发布室内场景重建方法SceneScript:能够直接从视频流中预测出室内场景的三维模型

  • Meta发布室内场景重建方法SceneScript:能够直接从视频流中预测出室内场景的三维模型
    AI
  • Meta发布了一种使用自回归结构化语言模型重建场景的方法SceneScript。该方法使用场景语言编码器-解码器架构,直接从编码的视觉数据中推断出一组结构化的语言命令。为了训练SceneScript,作者生成并发布了一个大规模 ...... 阅读全文

    优惠 模型缩放策略Scaling on Scales:挑战传统上认为“越大越好”的观念

  • 模型缩放策略Scaling on Scales:挑战传统上认为“越大越好”的观念
    AI
  • 这篇论文探讨了一个有趣的问题:我们是否总是需要更大的视觉模型来获得更好的视觉理解?作者们提出了一种名为“Scaling on Scales”(S2)的方法,这是一种在图像尺度上进行扩展的策略,而不是简单地增加模型的大小。 ...... 阅读全文

    优惠 D-MoLM:帮助语言模型(LMs)理解和解释三维分子结构

  • D-MoLM:帮助语言模型(LMs)理解和解释三维分子结构
    AI
  • 来自中国科学技术大学、新加坡国立大学和华为云的研究团队推出3D-MoLM,它旨在帮助语言模型(LMs)理解和解释三维分子结构。想象一下,你有一个复杂的化学分子,想要了解它的具体结构和特性,但是没有专业的化学知识 ...... 阅读全文

    优惠 大语言模型微调框架LLAMAFACTORY:使用户能够灵活地自定义微调100多个不同的大语言模型

  • 大语言模型微调框架LLAMAFACTORY:使用户能够灵活地自定义微调100多个不同的大语言模型
    AI
  • 来自北航的研究团队推出大语言模型微调框架LLAMAFACTORY,它是一个用于高效微调大语言模型(LLMs)的统一平台。LLAMAFACTORY通过整合一系列最新的高效训练方法,使用户能够灵活地自定义微调100多个不同的LLMs,而无 ...... 阅读全文