推荐类别

栏目分类

优惠 阿里巴巴 Qwen 团队推出AUTOIF方法,提升大语言模型遵循指令的能力

  • 阿里巴巴 Qwen 团队推出AUTOIF方法,提升大语言模型遵循指令的能力
    AI
  • 阿里巴巴 Qwen 团队推出AUTOIF方法,提升大语言模型(LLMs)遵循指令的能力。想象一下,你有一个非常聪明的助手,它可以阅读和理解你给出的任何指令,然后用自然语言做出回应。但是,如果我们想让这个助手更好地理解 ...... 阅读全文

    优惠 提升语言模型在视觉常识推理方面的能力

  • 提升语言模型在视觉常识推理方面的能力
    AI
  • 耶路撒冷希伯来大学和巴伊兰大学的研究人员发布论文,论文的主题是关于如何提升语言模型在视觉常识推理方面的能力。简单来说,就是教会计算机如何更好地理解图片,并结合文字信息来做出更准确的判断。论文中提出的方 ...... 阅读全文

    优惠 MIRAGE:利用模型内部信息来确保大语言模型生成的答案能够准确引用支持文档

  • MIRAGE:利用模型内部信息来确保大语言模型生成的答案能够准确引用支持文档
    AI
  • 格罗宁根大学语言与认知中心 (CLCG)和阿姆斯特丹大学逻辑、语言与计算研究所 (ILLC)的研究人员推出MIRAGE(Model Internals-based RAG Explanations),它利用模型内部信息来确保大语言模型(LLMs)生成的答案能够准 ...... 阅读全文

    优惠 Latent Diffusion Models:用于在极短的时间内从2D图像数据高效生成3D场景

  • Latent Diffusion Models:用于在极短的时间内从2D图像数据高效生成3D场景
    AI
  • 格拉斯哥大学和爱丁堡大学的研究人员推出新技术Latent Diffusion Models,用于在极短的时间内从2D图像数据高效生成3D场景。这项技术的核心是一种自编码器,它能够将多视角的2D图像映射到3D高斯Splats,同时构建这些S ...... 阅读全文

    优惠 新型自主强化学习方法DigiRL:专门用于训练能够在现实世界环境控制设备(如智能手机等)的智能代理

  • 新型自主强化学习方法DigiRL:专门用于训练能够在现实世界环境控制设备(如智能手机等)的智能代理
    AI
  • 加州大学伯克利分校、伊利诺伊大学伯克利分校和谷歌 DeepMind的研究人员推出新型自主强化学习方法DigiRL,它专门用于训练能够在野外(即现实世界环境)控制设备(如智能手机等)的智能代理。这些智能代理可以通过图 ...... 阅读全文

    优惠 新基准测试工具τ-bench:专门用来评估语言代理(智能助手或聊天机器人)在真实世界应用场景中与人类用户互动的能力

  • 新基准测试工具τ-bench:专门用来评估语言代理(智能助手或聊天机器人)在真实世界应用场景中与人类用户互动的能力
    AI
  • Sierra推出新基准测试工具τ-bench,它专门用来评估语言代理(也就是我们通常所说的智能助手或聊天机器人)在真实世界应用场景中与人类用户互动的能力。这就像是给智能助手们进行一次全面的“模拟考试”,看看它们在实 ...... 阅读全文

    优惠 新型基准测试工具REPOEXEC:用于评估代码生成模型在处理整个代码库级别的任务时的能力

  • 新型基准测试工具REPOEXEC:用于评估代码生成模型在处理整个代码库级别的任务时的能力
    AI
  • 越南FPT 软件 AI 中心和富布赖特大学的研究人员推出新型基准测试工具REPOEXEC,它用于评估代码生成模型(CodeLLMs)在处理整个代码库级别的任务时的能力。REPOEXEC的核心目标是测试这些模型生成的代码是否可执行、功 ...... 阅读全文

    优惠 新型预训练方法“指令预训练(Instruction Pre-Training)”:通过在原始语料库中加入指令-响应对来增强传统的语言模型的预训练过程

  • 新型预训练方法“指令预训练(Instruction Pre-Training)”:通过在原始语料库中加入指令-响应对来增强传统的语言模型的预训练过程
    AI
  • 微软研究院和清华大学的研究人员推出一种新型的预训练方法,名为“指令预训练”(Instruction Pre-Training),这种方法通过在原始语料库中加入指令-响应对来增强传统的语言模型(LMs)的预训练过程。指令-响应对是由 ...... 阅读全文

    优惠 大语言模型中实现“忘却”(unlearning)的能力,即从模型中移除特定概念或信息

  • 大语言模型中实现“忘却”(unlearning)的能力,即从模型中移除特定概念或信息
    AI
  • 华南理工大学、多伦多大学、巴伊兰大学、中国国际数字经济学院 (IDEA) 和特拉维夫大学的研究人员发布论文,论文的主题是探讨在大语言模型(LLMs)中实现“忘却”(unlearning)的能力,即从模型中移除特定概念或信息。 ...... 阅读全文

    优惠 自监督语音模型的接口设计

  • 自监督语音模型的接口设计
    AI
  • 美国德克萨斯大学奥斯汀分校计算机科学系的研究人员发布论文,论文的主题是关于自监督语音模型(Self-Supervised Speech Learning, SSL)的接口设计。自监督语音模型是一种通过大量未标记数据进行预训练,然后在少量 ...... 阅读全文

    优惠 模型编辑技术对跨语言性能的影响,特别是在多语言环境中的表现

  • 模型编辑技术对跨语言性能的影响,特别是在多语言环境中的表现
    AI
  • 印度理工学院、美国国家标准与技术研究所和新加坡科技设计大学的研究人员发布论文,论文的主题是探讨模型编辑技术对跨语言性能的影响,特别是在多语言环境中的表现。模型编辑技术允许我们对预训练语言模型(PLMs)进 ...... 阅读全文

    优惠 新型大语言模型Self-MoE:将传统的单一大型模型转变为由多个自专业化专家组成的模块化系统

  • 新型大语言模型Self-MoE:将传统的单一大型模型转变为由多个自专业化专家组成的模块化系统
    AI
  • 佐治亚理工学院、MIT-IBM Watson AI 实验室、麻省理工学院、加州大学圣地亚哥分校和MBZUAI的研究人员发布新型大语言模型Self-MoE,它将传统的单一大型模型转变为由多个自专业化专家组成的模块化系统,这些专家被称为 ...... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?