推荐类别

栏目分类

优惠 RT-Sketch系统:让机器人理解用户手绘的草图,并根据这些草图来执行动作

  • RT-Sketch系统:让机器人理解用户手绘的草图,并根据这些草图来执行动作
    AI
  • 斯坦福大学和谷歌的研究人员推出RT-Sketch系统,它是一个目标条件化的模仿学习(Imitation Learning, IL)策略,用于机器人操控任务。RT-Sketch的核心特点是它能够理解用户手绘的草图,并根据这些草图来执行动作。这种方法旨在解决自然语言指令可能存在的歧义性以及图像可能过于具体的问题。 项目主页... 阅读全文

    优惠 Modeling Collaborator框架:通过自然语言交互来替代人工标注,大幅减少定义概念所需的工作量

  • Modeling Collaborator框架:通过自然语言交互来替代人工标注,大幅减少定义概念所需的工作量
    AI
  • 来自华盛顿大学和谷歌的研究人员推出Modeling Collaborator框架,它是一个创新的工具,旨在帮助人们以最小的努力训练视觉模型来识别复杂或主观的视觉概念。在日常生活中,我们经常需要计算机视觉系统来识别图片中的内容,比如区分美食、艺术品或者判断某个场景是否安全。但是,传统的训练方法需要大量的手动标注工作,这既... 阅读全文

    优惠 加州大学伯克利分校最新研究:机器人双手协同拧瓶盖

  • 加州大学伯克利分校最新研究:机器人双手协同拧瓶盖
    AI
  • 加州大学伯克利分校的研究人员发布论文,该主题是关于如何训练一个由两个多指机器人手组成的系统,使其能够旋转(拧开)各种类似瓶子物体的盖子。这个研究项目使用了深度强化学习(Deep Reinforcement Learning, DRL)技术,首先在模拟环境中训练控制策略,然后将这个策略零次转移(zero-shot tra... 阅读全文

    优惠 MovieLLM框架:旨在通过GPT-4生成的电影相关的合成数据(包括剧本、关键帧图像等)来训练多模态大语言模型

  • MovieLLM框架:旨在通过GPT-4生成的电影相关的合成数据(包括剧本、关键帧图像等)来训练多模态大语言模型
    AI
  • 来自复旦大学和腾讯的研究人员推出MovieLLM框架,它旨在通过GPT-4生成的电影相关的合成数据(包括剧本、关键帧图像等)来训练多模态大型语言模型。这些模型经过训练后,能够更好地理解和处理长视频内容。简单来说,MovieLLM创建了一种模拟电影内容的数据集,这些数据集被用来训练AI模型,使其能够更好地理解和回答关于长... 阅读全文

    情报 中科院今年上半年发布自研 AI 大模型“紫东太初 3.0”,优化智能驾驶训练

  • 中科院今年上半年发布自研 AI 大模型“紫东太初 3.0”,优化智能驾驶训练
  • 近日,武汉人工智能研究院联合中国科学院自动化研究所宣布,自主研发的“紫东太初”大模型已迭代至2.0版本,并预计在今年上半年发布全新的3.0版本。这一创新性的技术进展,无疑将为人工智能领域带来更为深远的影响。 据武汉人工智能研究院院长王金桥介绍,紫东太初3.0的发布将进一步增强大模型对各行业的赋能能力。特别是与东风汽车、... 阅读全文

    情报 《黄金神威》电视剧版即将开播,演员阵容与制作团队与电影版相同

  • 《黄金神威》电视剧版即将开播,演员阵容与制作团队与电影版相同
  • 备受期待的真人版电影《黄金神威》的续作电视剧版正式宣布将于今年秋季开播。这部以野田サトル的漫画为原著改编的作品,继续以明治时代后期的北海道为舞台,展现了一场充满惊险与刺激的生存竞争。 电视剧版《黄金神威 ―北海道刺青囚人争夺编―》将延续电影版的精彩故事,演员阵容与制作团队也保持不变。山崎贤人、山田杏奈、真荣田乡敦、矢本... 阅读全文

    优惠 Anthropic 推出 Claude 3 系列大语言模型,革新认知任务处理性能

  • Anthropic 推出 Claude 3 系列大语言模型,革新认知任务处理性能
    AI
  • Anthropic在今天发布了其创新的Claude 3系列大语言模型(LLM),为各种认知任务设定了新的性能标准。该系列包含三个子模型:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,它们为用户提供了不同的智能、速度和成本选择,以满足多样化的人工智能应用需求。 卓越性能:超越G... 阅读全文

    优惠 免费AI生成照片图库StockCake,开放公众领域授权使用

  • 免费AI生成照片图库StockCake,开放公众领域授权使用
    AI
  • StockCake 是一个专注于提供由人工智能技术生成照片的在线图库,其独特之处在于所有收录的照片皆源于AI算法创新创造。这些图片采用公众领域授权方式发布,这意味着用户可以在个人项目或商业用途中自由使用它们,无需事先取得网站运营方的许可,同时也不必注明图片出处。 该图库内的相片质量堪比真实拍摄,通过精准的关键字搜索和标... 阅读全文

    装备 搭载 M3 芯片的 2024 款苹果 MacBook Air 发布 8999 元起

  • 搭载 M3 芯片的 2024 款苹果 MacBook Air 发布
    苹果官网
  • 苹果于今日发布了搭载 M3 芯片 MacBook Air 系列,提供 13 英寸和 15 英寸两种屏幕尺寸,带来更强劲的性能、增强的外接显示器支持、Wi-Fi 6E 等一系列升级。新机型将于 3 月 6 日上午 9 点接受订购,3 月 8 日发售,售价 8999 元起。新款 MacBook Air 采用了性能更强劲的 ... 阅读全文

    优惠 在线工具平台Pixelied推出全新升级的颜色调色板生成器

  • 在线工具平台Pixelied推出全新升级的颜色调色板生成器
    工具
  • 在线工具平台Pixelied推出全新升级的颜色调色板生成器,这一工具是其强大设计解决方案的重要组成部分。作为产品设计领域的领导者,Quba及团队始终致力于为用户提供一体化的设计体验。Pixelied的旅程始于提供全方位设计服务的目标,而今,在色彩管理领域取得了显著的进步。全新的颜色调色板生成器旨在简化并增强设计师的工作... 阅读全文

    优惠 Meta推出新型自监督学习方法Image World Models(IWM):通过学习一个世界模型来理解和预测图像的变化

  • Meta推出新型自监督学习方法Image World Models(IWM):通过学习一个世界模型来理解和预测图像的变化
    AI
  • Meta推出新型自监督学习方法Image World Models(IWM),它通过学习一个世界模型来理解和预测图像的变化。想象一下,你有一个智能相机,它不仅能拍摄照片,还能理解照片中的内容,并预测如果对照片进行某些修改(比如改变亮度或对比度),照片会变成什么样子。IWM就是这样一个系统,它可以帮助计算机更好地理解和处... 阅读全文

    优惠 RESONANCE RoPE(共振旋转位置编码):改善大语言模型(LLMs)在处理长文本时的性能

  • RESONANCE RoPE(共振旋转位置编码):改善大语言模型(LLMs)在处理长文本时的性能
    AI
  • 来自蒙特利尔大学、魁北克人工智能研究所、华为诺亚方舟实验室的研究人员发布论文介绍了一种名为RESONANCE RoPE(共振旋转位置编码)的技术,它旨在改善大语言模型(LLMs)在处理长文本时的性能。在训练时,模型通常处理较短的文本序列,但在实际应用中可能需要处理更长的文本,这就是所谓的“训练短-测试长”(TSTL)场... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?