推荐类别

栏目分类

优惠 Depth Anywhere:360度全景图像的深度估计的准确性

  • Depth Anywhere:360度全景图像的深度估计的准确性
    AI
  • 阳明交通大学的研究人员推出Depth Anywhere,提高360度全景图像的深度估计的准确性。深度估计是一种计算机视觉技术,它可以帮助计算机理解图像中物体的远近关系,这对于虚拟现实、自动驾驶导航和沉浸式媒体应用等领域非常重要。此方法在一些基准数据集上进行了测试,显示出在零样本(zero-shot)情况下,也就是模型在... 阅读全文

    优惠 在RAG系统中是如何依赖外部检索到的上下文信息来回答问题

  • 在RAG系统中是如何依赖外部检索到的上下文信息来回答问题
    AI
  • 马萨诸塞大学阿默斯特分校、微软和马里兰大学帕克分校的研究人员发布论文,论文的主题是探讨在检索增强生成(Retrieval-Augmented Generation, RAG)系统中,语言模型在回答事实性问题时,是如何利用外部知识与模型内部参数信息的。RAG系统通过引入外部上下文来增强语言模型的推理能力,这在搜索、问答和... 阅读全文

    优惠 新型音乐生成模型JEN-1 DreamStyler:根据用户提供的参考音乐片段,学习并捕捉音乐中的独特概念,然后生成符合这一概念的新音乐作品

  • 新型音乐生成模型JEN-1 DreamStyler:根据用户提供的参考音乐片段,学习并捕捉音乐中的独特概念,然后生成符合这一概念的新音乐作品
    AI
  • 新型音乐生成模型JEN-1 DreamStyler,它能够根据用户提供的参考音乐片段,学习并捕捉音乐中的独特概念,然后生成符合这一概念的新音乐作品。JEN-1 DreamStyler在定性和定量评估中都优于几个基线模型,并且提供了演示,可以在其网站上听到生成的音乐示例。此外,论文还介绍了一个新的数据集和评估协议来支持这... 阅读全文

    优惠 评估框架HPT:更精确地评估大语言模型在处理不同任务时的有效性

  • 评估框架HPT:更精确地评估大语言模型在处理不同任务时的有效性
    AI
  • 印度理工学院、美国南卡罗来纳大学人工智能研究所、美国罗彻斯特理工学院、美国亚马逊 GenAI和美国斯坦福大学推出评估框架“Hierarchical Prompting Taxonomy (HPT)”,用于更精确地评估大语言模型(LLMs)在处理不同任务时的有效性。这个框架特别关注了如何根据不同任务的复杂性,采用不同层次... 阅读全文

    优惠 在线偏好学习算法“行为临近偏好优化(BPO)”:改善大语言模型与人类期望的一致性

  • 在线偏好学习算法“行为临近偏好优化(BPO)”:改善大语言模型与人类期望的一致性
    AI
  • 加州大学圣巴巴拉分校和卡内基梅隆大学的研究人员推出新的在线偏好学习算法,名为“行为临近偏好优化”(BPO),它用于改善大语言模型(LLMs)与人类期望的一致性。BPO算法的核心思想是在模型训练过程中,使学习到的语言模型尽可能地接近行为模型(即生成训练样本的模型),以此来构建一个更合适的信任域,从而提高模型的性能。 例如... 阅读全文

    优惠 自对齐使用DPO隐式奖励DICE:利用了直接偏好优化(DPO)训练后的隐式奖励模型来进一步优化语言模型

  • 自对齐使用DPO隐式奖励DICE:利用了直接偏好优化(DPO)训练后的隐式奖励模型来进一步优化语言模型
    AI
  • ···q新加坡管理大学、新加坡Sea AI实验室、新加坡国立大学和罗格斯大学的研究人员推出自对齐使用DPO隐式奖励DICE,这个方法利用了直接偏好优化(DPO)训练后的隐式奖励模型来进一步优化语言模型。实验结果表明,DICE在保持模型大小不变的情况下,显著提高了语言模型的性能,甚至在某些方面超过了需要额外人类反馈的封闭... 阅读全文

    优惠 多图像关系基准新评估工具 MIRB:用来衡量这些模型在处理和推理多个图像时的表现,评估和测试视觉语言模型在理解多图像方面的能力

  • 多图像关系基准新评估工具 MIRB:用来衡量这些模型在处理和推理多个图像时的表现,评估和测试视觉语言模型在理解多图像方面的能力
    AI
  • 爱丁堡大学和同济大学的研究人员推出新评估工具 MIRB(Multi-Image Relational Benchmark, 多图像关系基准),用来衡量这些模型在处理和推理多个图像时的表现,评估和测试视觉语言模型(VLMs)在理解多图像方面的能力。论文通过广泛的评估发现,尽管在单图像任务中一些开源的视觉语言模型能够与一些... 阅读全文

    优惠 分词的诅咒:在大语言模型中,文本分词(tokenization)这一预处理步骤存在的问题,以及这些问题对模型性能的影响

  • 分词的诅咒:在大语言模型中,文本分词(tokenization)这一预处理步骤存在的问题,以及这些问题对模型性能的影响
    AI
  • 百度、ModelBest和UCPH的研究人员发布论文 ,论文的主题是探讨了在大语言模型(LLMs)中,文本分词(tokenization)这一预处理步骤存在的问题,以及这些问题对模型性能的影响。分词是将原始文本转换成一系列子词(subword)标识符的过程,这个过程对拼写错误、文本长度变化非常敏感,并且往往忽略了词内结... 阅读全文

    优惠 新型二值化技术“Mixture of Scales”:用于压缩大语言模型

  • 新型二值化技术“Mixture of Scales”:用于压缩大语言模型
    AI
  • 首尔国立大学、 SqueezeBits和成均馆大学的研究人员推出新型二值化技术“Mixture of Scales”(简称BinaryMoS),它主要用于压缩大语言模型(LLMs)。二值化是一种将模型中的权重参数转换为二进制值的方法,可以显著减少模型的大小,但传统的二值化技术会牺牲模型的语言能力。BinaryMoS通过... 阅读全文

    优惠 HumanSplat:通过单张图片来预测任何人的3D高斯Splatting属性

  • HumanSplat:通过单张图片来预测任何人的3D高斯Splatting属性
    AI
  • 字节跳动、北京大学、厦门大学和清华大学的研究人员推出新技术HumanSplat,它能够通过单张图片来预测任何人的3D高斯Splatting属性。简单来说,就是利用人工智能技术,从一张照片中重建出一个逼真的3D人体模型。这项技术的出现,不仅推动了计算机视觉领域的发展,也为3D内容的创建和展示提供了新的可能性。 项目主页:... 阅读全文

    优惠 新型大语言模型TABULA-8B:专门用于处理表格数据

  • 新型大语言模型TABULA-8B:专门用于处理表格数据
    AI
  • 华盛顿大学、哈佛大学和斯坦福大学的研究人员推出新型大语言模型TABULA-8B,它专门用于处理表格数据(Tabular Data)。表格数据是一种结构化、异构的、类似电子表格的数据形式,它在许多领域中都有广泛应用,比如医疗、金融、政府和自然科学等。 例如,你有一大堆来自不同地方的数据表,这些数据表里充满了数字、文字和日... 阅读全文

    优惠 评估平台OlympicArena:专门用来测试和衡量AI模型在解决高难度问题时的认知推理能力

  • 评估平台OlympicArena:专门用来测试和衡量AI模型在解决高难度问题时的认知推理能力
    AI
  • 上海交通大学、上海人工智能实验室、 生成式人工智能研究实验室(GAIR)的研究人员推出评估平台OlympicArena,它专门用来测试和衡量人工智能(AI)模型在解决高难度问题时的认知推理能力。这些问题的难度级别相当于奥林匹克竞赛水平,涵盖了多个学科领域。 项目主页:https://gair-nlp.github.io... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?