推荐类别

栏目分类

优惠 Beyond Scaling Laws:探讨Transformer模型在语言处理任务中的表现,特别是它们在记忆训练样本时的性能动态

  • Beyond Scaling Laws:探讨Transformer模型在语言处理任务中的表现,特别是它们在记忆训练样本时的性能动态
    AI
  • 华为发布论文探讨Transformer模型在语言处理任务中的表现,特别是它们在记忆训练样本时的性能动态。论文提出了一个理论框架,用于解释基于Transformer的语言模型的记忆力过程和性能表现。研究的核心问题是,为什么增加Transformer模型的大小并不总是导致性能提升,以及这些模型是如何通过记忆训练样本来提高泛... 阅读全文

    优惠 华为诺亚方舟实验室推出轻量级视频理解网络SqueezeTime:专为移动设备上的视频理解任务设计

  • 华为诺亚方舟实验室推出轻量级视频理解网络SqueezeTime:专为移动设备上的视频理解任务设计
    AI
  • 华为诺亚方舟实验室推出一种新型的轻量级视频理解网络SqueezeTime,专为移动设备上的视频理解任务设计。在移动设备上进行视频分析面临着计算能力和内存的严格限制,而传统的视频理解方法,如3D卷积网络,通常需要大量的计算和内存资源,不适合在移动设备上运行。总的来说,SqueezeTime为移动设备上的视频理解提供了一种... 阅读全文

    优惠 小多科技推出新型多模态视觉语言模型Xmodel-VLM

  • 小多科技推出新型多模态视觉语言模型Xmodel-VLM
    AI
  • 小多科技推出新型多模态视觉语言模型Xmodel-VLM,这个模型的主要目标是为了在消费级GPU服务器上高效部署,解决大规模多模态系统由于高昂的服务成本而难以广泛采用的关键行业问题。例如,我们有一个智能助手,它可以看图片,理解文字,然后用自然语言和我们交流。这个助手就像是电影里的“贾维斯”(J.A.R.V.I.S.),但... 阅读全文

    优惠 ALPINE:调查Transformer模型是否能够通过自回归学习来执行规划任务,并识别其在规划能力方面的潜在限制

  • ALPINE:调查Transformer模型是否能够通过自回归学习来执行规划任务,并识别其在规划能力方面的潜在限制
    AI
  • 微软亚洲研究院发布论文,探讨在基于Transformer的语言模型(LLMs)中,通过自回归学习机制发展出的规划能力。项目ALPINE(Autoregressive Learning for Planning In NEtworks)旨在理论上调查Transformer模型是否能够通过自回归学习来执行规划任务,并识别其... 阅读全文

    优惠 新型工具集BEHAVIOR Vision Suite (BVS):能够通过模拟生成完全定制化的合成数据,用于系统性地评估计算机视觉模型

  • 新型工具集BEHAVIOR Vision Suite (BVS):能够通过模拟生成完全定制化的合成数据,用于系统性地评估计算机视觉模型
    AI
  • 斯坦福大学、 南加州大学、哈佛大学、Meta、德克萨斯大学奥斯汀分校、 伊利诺伊大学厄巴纳-香槟分校的研究人员推出新型工具集BEHAVIOR Vision Suite (BVS),它能够通过模拟生成完全定制化的合成数据,用于系统性地评估计算机视觉模型。想象一下,如果你是一位计算机视觉研究员,你需要大量的、具有特定标签的... 阅读全文

    优惠 通过使用先进的潜在扩散模型和ControlNet技术,从脑电图数据中解码音乐信息,为音乐生成和脑机接口领域提供了新的视角和可能性

  • 通过使用先进的潜在扩散模型和ControlNet技术,从脑电图数据中解码音乐信息,为音乐生成和脑机接口领域提供了新的视角和可能性
    AI
  • 来自威尼斯福斯卡里大学、罗马第一大学和索尼 CSL的研究人员发布论文,探索使用潜在扩散模型(latent diffusion models)从脑电图(EEG)数据中重建自然主义音乐。脑电图是一种记录大脑活动的技术,而自然主义音乐指的是包含多种乐器、声音和效果的复杂音乐,这类音乐在和声和音色上都很丰富。 主要功能: 该研... 阅读全文

    优惠 新型文本到3D生成框架Dual3D:它能够在短短1分钟内生成高质量的3D资产

  • 新型文本到3D生成框架Dual3D:它能够在短短1分钟内生成高质量的3D资产
    AI
  • 来自厦门大学、香港中文大学和上海人工智能实验室的研究人员推出新型文本到3D生成框架Dual3D,它能够在短短1分钟内生成高质量的3D资产。这项技术的关键在于一个创新的双模式多视图潜在扩散模型,这个模型能够从文本描述中高效地创建出三维物体。Dual3D是一个强大的工具,它结合了先进的AI技术,使得从文本描述到3D模型的生... 阅读全文

    优惠 谷歌推出CAT3D:从任意数量的生成或真实图像中创建3D场景

  • 谷歌推出CAT3D:从任意数量的生成或真实图像中创建3D场景
    AI
  • 谷歌推出CAT3D,它可以从任意数量的生成或真实图像中创建3D场景。CAT3D是一个强大的工具,它通过模拟真实世界的3D捕捉过程,使得从2D图像到3D场景的转换变得快速而高效,极大地推动了3D内容创作的边界。例如,你是一名游戏设计师、电影特效师或者虚拟现实内容创作者,你需要将一个真实世界的场景转换成3D模型,这在过去通... 阅读全文

    优惠 TRANSIC:帮助机器人通过人类的在线指导来学习如何在现实世界中执行任务

  • TRANSIC:帮助机器人通过人类的在线指导来学习如何在现实世界中执行任务
    AI
  • 斯坦福大学的研究团队发布论文,这篇论文的主题是关于如何将模拟环境中学习到的机器人策略成功地转移到现实世界中,这在机器人学习领域被称为“仿真到现实(Sim-to-Real)”的转换。例如,你在一个视频游戏中练习驾驶赛车,然后你想要将你在游戏里学到的技能应用到真实世界中的驾驶。这听起来可能很简单,但现实情况要复杂得多,因为... 阅读全文

    优惠 Toon3D:将手绘的卡通和动漫图像转换成三维模型

  • Toon3D:将手绘的卡通和动漫图像转换成三维模型
    AI
  • Teton.ai和加州大学伯克利分校的研究团队推出新技术Toon3D,它能够将手绘的卡通和动漫图像转换成三维模型。这项技术特别适用于那些在创作过程中没有使用三维渲染引擎的卡通和动漫场景,因为这些场景的图像通常在不同的视角下会存在几何上的不一致性。开发者还提供了Toon3D Labeler和Toon3D Dataset,... 阅读全文

    优惠 Many-Shot ICL:多模态基础模型在多示例情境学习中的性能

  • Many-Shot ICL:多模态基础模型在多示例情境学习中的性能
    AI
  • 斯坦福大学的研究团队发布论文探索多模态基础模型在多示例情境学习(Many-Shot In-Context Learning,简称Many-Shot ICL)中的性能。多模态基础模型是指能够处理和理解多种类型数据(如文本、图像等)的大型AI模型。而多示例情境学习是指在模型的输入上下文中提供多个示例,以便模型能够在没有额外... 阅读全文

    优惠 用于训练大语言模型的工作流程RLHF:让这些模型更好地符合人类的价值观和偏好

  • 用于训练大语言模型的工作流程RLHF:让这些模型更好地符合人类的价值观和偏好
    AI
  • 来自Salesforce AI Research和伊利诺伊大学厄巴纳-香槟分校的研究人员推出一种名为在线迭代强化学习从人类反馈(Online Iterative Reinforcement Learning from Human Feedback,简称RLHF)的工作流程。这是一种用于训练大语言模型(Large Lan... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?