AI

优惠 文本到语音(TTS)合成系统NaturalSpeech 3:生成自然、高质量且具有零样本(zero-shot)能力的语音

  • 文本到语音(TTS)合成系统NaturalSpeech 3:生成自然、高质量且具有零样本(zero-shot)能力的语音
    AI
  • 来自微软亚洲研究院、中国科学技术大学、香港中文大学(深圳)、浙江大学、东京大学、北京大学的研究人员推出文本到语音(TTS)合成系统NaturalSpeech 3。这个系统的目标是生成自然、高质量且具有零样本(zero-shot ...... 阅读全文

    优惠 新型3D建模工具MagicClay:结合了Neural Fields和Meshes的混合表示方法,允许用户通过文本提示来雕塑和编辑3D模型

  • 新型3D建模工具MagicClay:结合了Neural Fields和Meshes的混合表示方法,允许用户通过文本提示来雕塑和编辑3D模型
    AI
  • 特拉维夫大学、Adobe 研究中心、加拿大蒙特利尔大学的研究人员推出新型3D建模工具MagicClay,它结合了神经场(Neural Fields)和三角网格(Meshes)的混合表示方法,允许用户通过文本提示来雕塑和编辑3D模型。这种方 ...... 阅读全文

    优惠 RT-Sketch系统:让机器人理解用户手绘的草图,并根据这些草图来执行动作

  • RT-Sketch系统:让机器人理解用户手绘的草图,并根据这些草图来执行动作
    AI
  • 斯坦福大学和谷歌的研究人员推出RT-Sketch系统,它是一个目标条件化的模仿学习(Imitation Learning, IL)策略,用于机器人操控任务。RT-Sketch的核心特点是它能够理解用户手绘的草图,并根据这些草图来执行动作。这 ...... 阅读全文

    优惠 Modeling Collaborator框架:通过自然语言交互来替代人工标注,大幅减少定义概念所需的工作量

  • Modeling Collaborator框架:通过自然语言交互来替代人工标注,大幅减少定义概念所需的工作量
    AI
  • 来自华盛顿大学和谷歌的研究人员推出Modeling Collaborator框架,它是一个创新的工具,旨在帮助人们以最小的努力训练视觉模型来识别复杂或主观的视觉概念。在日常生活中,我们经常需要计算机视觉系统来识别图片中的 ...... 阅读全文

    优惠 加州大学伯克利分校最新研究:机器人双手协同拧瓶盖

  • 加州大学伯克利分校最新研究:机器人双手协同拧瓶盖
    AI
  • 加州大学伯克利分校的研究人员发布论文,该主题是关于如何训练一个由两个多指机器人手组成的系统,使其能够旋转(拧开)各种类似瓶子物体的盖子。这个研究项目使用了深度强化学习(Deep Reinforcement Learning, DRL ...... 阅读全文

    优惠 MovieLLM框架:旨在通过GPT-4生成的电影相关的合成数据(包括剧本、关键帧图像等)来训练多模态大语言模型

  • MovieLLM框架:旨在通过GPT-4生成的电影相关的合成数据(包括剧本、关键帧图像等)来训练多模态大语言模型
    AI
  • 来自复旦大学和腾讯的研究人员推出MovieLLM框架,它旨在通过GPT-4生成的电影相关的合成数据(包括剧本、关键帧图像等)来训练多模态大型语言模型。这些模型经过训练后,能够更好地理解和处理长视频内容。简单来说,M ...... 阅读全文

    优惠 Anthropic 推出 Claude 3 系列大语言模型,革新认知任务处理性能

  • Anthropic 推出 Claude 3 系列大语言模型,革新认知任务处理性能
    AI
  • Anthropic在今天发布了其创新的Claude 3系列大语言模型(LLM),为各种认知任务设定了新的性能标准。该系列包含三个子模型:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,它们为用户提供了不同的智能、速度和成 ...... 阅读全文

    优惠 免费AI生成照片图库StockCake,开放公众领域授权使用

  • 免费AI生成照片图库StockCake,开放公众领域授权使用
    AI
  • StockCake 是一个专注于提供由人工智能技术生成照片的在线图库,其独特之处在于所有收录的照片皆源于AI算法创新创造。这些图片采用公众领域授权方式发布,这意味着用户可以在个人项目或商业用途中自由使用它们,无需 ...... 阅读全文

    优惠 Meta推出新型自监督学习方法Image World Models(IWM):通过学习一个世界模型来理解和预测图像的变化

  • Meta推出新型自监督学习方法Image World Models(IWM):通过学习一个世界模型来理解和预测图像的变化
    AI
  • Meta推出新型自监督学习方法Image World Models(IWM),它通过学习一个世界模型来理解和预测图像的变化。想象一下,你有一个智能相机,它不仅能拍摄照片,还能理解照片中的内容,并预测如果对照片进行某些修改(比 ...... 阅读全文

    优惠 RESONANCE RoPE(共振旋转位置编码):改善大语言模型(LLMs)在处理长文本时的性能

  • RESONANCE RoPE(共振旋转位置编码):改善大语言模型(LLMs)在处理长文本时的性能
    AI
  • 来自蒙特利尔大学、魁北克人工智能研究所、华为诺亚方舟实验室的研究人员发布论文介绍了一种名为RESONANCE RoPE(共振旋转位置编码)的技术,它旨在改善大语言模型(LLMs)在处理长文本时的性能。在训练时,模型通常 ...... 阅读全文

    优惠 AtP*(Attribution Patching*):用于定位大语言模型(LLM)中特定行为的组件

  • AtP*(Attribution Patching*):用于定位大语言模型(LLM)中特定行为的组件
    AI
  • Google DeepMind发布论文介绍了一种名为AtP*(Attribution Patching*)的高效且可扩展的方法,用于定位大语言模型(LLM)中特定行为的组件。想象一下,你有一个非常复杂的机器,比如一个巨大的乐高城堡,你想知道城 ...... 阅读全文

    优惠 数字人技术公司D-ID推出数字分身,上传知识库文件定制专属数字人

  • 数字人技术公司D-ID推出数字分身,上传知识库文件定制专属数字人
    AI
  • D-ID是一家提供AI拟真人影片产品服务和开发的公司。只需上传人物照片并输入要说的内容,AI语音机器人就能自动将其转换成音频。近日官方推出数字分身服务,这项服用与百度在过年期间推出的数字分身差不多,只是D-ID这 ...... 阅读全文