推荐类别

栏目分类

优惠 新型低延迟大语言模型推理框架LiveMind:语言模型能够在接收到不完整的提示(prompts)时就开始进行推理,从而减少用户等待响应的时间,提高交互体验

  • 新型低延迟大语言模型推理框架LiveMind:语言模型能够在接收到不完整的提示(prompts)时就开始进行推理,从而减少用户等待响应的时间,提高交互体验
    AI
  • 慕尼黑工业大学、达姆施塔特工业大学和浙江大学的研究人员推出新型低延迟大语言模型推理框架LiveMind,LiveMind的核心思想是让语言模型能够在接收到不完整的提示(prompts)时就开始进行推理,从而减少用户等待响应的时间,提高交互体验。 主要功能: 低延迟推理:LiveMind允许LLMs在用户输入不完整时就开... 阅读全文

    优惠 阿里巴巴 Qwen 团队推出AUTOIF方法,提升大语言模型遵循指令的能力

  • 阿里巴巴 Qwen 团队推出AUTOIF方法,提升大语言模型遵循指令的能力
    AI
  • 阿里巴巴 Qwen 团队推出AUTOIF方法,提升大语言模型(LLMs)遵循指令的能力。想象一下,你有一个非常聪明的助手,它可以阅读和理解你给出的任何指令,然后用自然语言做出回应。但是,如果我们想让这个助手更好地理解和执行复杂的指令,就需要一些特别的方法来训练它。AUTOIF方法通过自我生成的执行反馈来增强LLMs的指... 阅读全文

    优惠 提升语言模型在视觉常识推理方面的能力

  • 提升语言模型在视觉常识推理方面的能力
    AI
  • 耶路撒冷希伯来大学和巴伊兰大学的研究人员发布论文,论文的主题是关于如何提升语言模型在视觉常识推理方面的能力。简单来说,就是教会计算机如何更好地理解图片,并结合文字信息来做出更准确的判断。论文中提出的方法通过在训练时使用图像和文本的配对数据,并在推理时生成多个图像并集成它们的预测结果,有效地提高了语言模型在视觉常识任务上... 阅读全文

    优惠 MIRAGE:利用模型内部信息来确保大语言模型生成的答案能够准确引用支持文档

  • MIRAGE:利用模型内部信息来确保大语言模型生成的答案能够准确引用支持文档
    AI
  • 格罗宁根大学语言与认知中心 (CLCG)和阿姆斯特丹大学逻辑、语言与计算研究所 (ILLC)的研究人员推出MIRAGE(Model Internals-based RAG Explanations),它利用模型内部信息来确保大语言模型(LLMs)生成的答案能够准确引用支持文档。关于提高检索增强型生成(Retrieval... 阅读全文

    优惠 Latent Diffusion Models:用于在极短的时间内从2D图像数据高效生成3D场景

  • Latent Diffusion Models:用于在极短的时间内从2D图像数据高效生成3D场景
    AI
  • 格拉斯哥大学和爱丁堡大学的研究人员推出新技术Latent Diffusion Models,用于在极短的时间内从2D图像数据高效生成3D场景。这项技术的核心是一种自编码器,它能够将多视角的2D图像映射到3D高斯Splats,同时构建这些Splats的压缩潜在表示。简单来说,就是通过一个智能的转换过程,把平面的多角度图片... 阅读全文

    优惠 新型自主强化学习方法DigiRL:专门用于训练能够在现实世界环境控制设备(如智能手机等)的智能代理

  • 新型自主强化学习方法DigiRL:专门用于训练能够在现实世界环境控制设备(如智能手机等)的智能代理
    AI
  • 加州大学伯克利分校、伊利诺伊大学伯克利分校和谷歌 DeepMind的研究人员推出新型自主强化学习方法DigiRL,它专门用于训练能够在野外(即现实世界环境)控制设备(如智能手机等)的智能代理。这些智能代理可以通过图形用户界面(GUI)执行各种任务,比如网上购物、预订旅行或者操作移动设备等。 项目主页:https://d... 阅读全文

    优惠 新基准测试工具τ-bench:专门用来评估语言代理(智能助手或聊天机器人)在真实世界应用场景中与人类用户互动的能力

  • 新基准测试工具τ-bench:专门用来评估语言代理(智能助手或聊天机器人)在真实世界应用场景中与人类用户互动的能力
    AI
  • Sierra推出新基准测试工具τ-bench,它专门用来评估语言代理(也就是我们通常所说的智能助手或聊天机器人)在真实世界应用场景中与人类用户互动的能力。这就像是给智能助手们进行一次全面的“模拟考试”,看看它们在实际工作中的表现如何。例如,你是一个航空公司的智能助手,用户想要更改他们的航班预订。你需要通过与用户的对话了... 阅读全文

    优惠 新型基准测试工具REPOEXEC:用于评估代码生成模型在处理整个代码库级别的任务时的能力

  • 新型基准测试工具REPOEXEC:用于评估代码生成模型在处理整个代码库级别的任务时的能力
    AI
  • 越南FPT 软件 AI 中心和富布赖特大学的研究人员推出新型基准测试工具REPOEXEC,它用于评估代码生成模型(CodeLLMs)在处理整个代码库级别的任务时的能力。REPOEXEC的核心目标是测试这些模型生成的代码是否可执行、功能正确,并且能够准确利用跨文件的上下文信息。实验结果表明,尽管预训练的大型语言模型(LL... 阅读全文

    优惠 新型预训练方法“指令预训练(Instruction Pre-Training)”:通过在原始语料库中加入指令-响应对来增强传统的语言模型的预训练过程

  • 新型预训练方法“指令预训练(Instruction Pre-Training)”:通过在原始语料库中加入指令-响应对来增强传统的语言模型的预训练过程
    AI
  • 微软研究院和清华大学的研究人员推出一种新型的预训练方法,名为“指令预训练”(Instruction Pre-Training),这种方法通过在原始语料库中加入指令-响应对来增强传统的语言模型(LMs)的预训练过程。指令-响应对是由一个高效的指令合成器生成的,该合成器基于开源模型构建。论文的实验结果表明,指令预训练在多种... 阅读全文

    优惠 大语言模型中实现“忘却”(unlearning)的能力,即从模型中移除特定概念或信息

  • 大语言模型中实现“忘却”(unlearning)的能力,即从模型中移除特定概念或信息
    AI
  • 华南理工大学、多伦多大学、巴伊兰大学、中国国际数字经济学院 (IDEA) 和特拉维夫大学的研究人员发布论文,论文的主题是探讨在大语言模型(LLMs)中实现“忘却”(unlearning)的能力,即从模型中移除特定概念或信息。这项研究非常重要,因为它有助于减轻模型可能产生的不良影响,例如生成有害、私密或错误的信息。 主要... 阅读全文

    优惠 自监督语音模型的接口设计

  • 自监督语音模型的接口设计
    AI
  • 美国德克萨斯大学奥斯汀分校计算机科学系的研究人员发布论文,论文的主题是关于自监督语音模型(Self-Supervised Speech Learning, SSL)的接口设计。自监督语音模型是一种通过大量未标记数据进行预训练,然后在少量标记数据上进行微调,以完成特定下游任务的模型。这些模型在自动语音识别等语音处理任务中... 阅读全文

    优惠 模型编辑技术对跨语言性能的影响,特别是在多语言环境中的表现

  • 模型编辑技术对跨语言性能的影响,特别是在多语言环境中的表现
    AI
  • 印度理工学院、美国国家标准与技术研究所和新加坡科技设计大学的研究人员发布论文,论文的主题是探讨模型编辑技术对跨语言性能的影响,特别是在多语言环境中的表现。模型编辑技术允许我们对预训练语言模型(PLMs)进行微调,以便它们能够更好地适应特定的输入和需求。这项技术在英文环境中已经取得了显著的成果,但同时也暴露了语言间的不平... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?