推荐类别

栏目分类

优惠 多模态智能体Optimus-1:能够在像《我的世界》这样的开放世界环境中执行长期任务

  • 多模态智能体Optimus-1:能够在像《我的世界》这样的开放世界环境中执行长期任务
    AI
  • 哈尔滨工业大学和鹏城实验室的研究人员推出多模态智能体“Optimus-1”,它能够在像《我的世界》这样的开放世界环境中执行长期任务。Optimus-1的核心是一个混合多模态记忆模块,这个模块由两个主要部分组成:分层指导知识图谱(HDKG)和抽象多模态经验池(AMEP)。这个智能体的设计灵感来源于人类如何利用长期记忆来完... 阅读全文

    优惠 大规模合成数据集VGGHeads:专门用于3D人头检测、关键点估计和3D头部模型拟合等重要任务

  • 大规模合成数据集VGGHeads:专门用于3D人头检测、关键点估计和3D头部模型拟合等重要任务
    AI
  • 牛津大学的研究人员推出大规模合成数据集VGGHeads,它专门用于3D人头检测、关键点估计和3D头部模型拟合等重要任务。这些任务在面部识别、动画制作、增强现实和医学成像等领域有着广泛的应用。例如,我们需要训练一个计算机视觉系统来识别图片中的人脸,并准确地模拟出人头的三维形状。这通常需要大量的真实人脸图片和相应的三维模型... 阅读全文

    优惠 交互式视频生成模型Puppet-Master:作为一个运动先验来捕捉物体部分级别的动力学

  • 交互式视频生成模型Puppet-Master:作为一个运动先验来捕捉物体部分级别的动力学
    AI
  • 牛津大学的研究人员推出交互式视频生成模型Puppet-Master,它可以作为一个运动先验来捕捉物体部分级别的动力学。简单来说,Puppet-Master能够根据单个图像和一组稀疏的运动轨迹(即拖动操作),合成一段展示逼真物体部分运动的视频。这就像是有一个虚拟的木偶大师,通过几个简单的手势指令,就能够控制视频中物体各部... 阅读全文

    优惠 大规模数据集“SG3D”:为了推动三维场景中任务导向的顺序定位任务的研究而创建

  • 大规模数据集“SG3D”:为了推动三维场景中任务导向的顺序定位任务的研究而创建
    AI
  • 北京通用人工智能研究院 (BIGAI) 、清华大学和北京理工大学的研究人员推出大规模数据集“SG3D”(Sequential Grounding in 3D Scenes),它是为了推动三维场景中任务导向的顺序定位(task-oriented sequential grounding)任务的研究而创建的。这项任务涉及到... 阅读全文

    优惠 LLM-DetectAIve:专门设计用来精细地检测机器生成的文本(MGTs)

  • LLM-DetectAIve:专门设计用来精细地检测机器生成的文本(MGTs)
    AI
  • 这篇论文介绍了一个名为“LLM-DetectAIve”的工具,它专门设计用来精细地检测机器生成的文本(MGTs)。随着大语言模型(LLMs)的普及,人们越来越难以区分文本是人类写的还是机器生成的。这在教育和学术领域尤其令人担忧,因为可能会有不正当使用机器生成文本的情况。论文还提到了这个工具的一些限制,比如它目前只支持英... 阅读全文

    优惠 新型数据集和对比学习合成方法Img-Diff:专注于为多模态大语言模型提升细粒度图像识别能力

  • 新型数据集和对比学习合成方法Img-Diff:专注于为多模态大语言模型提升细粒度图像识别能力
    AI
  • 阿里巴巴和中山大学的研究人员推出新型数据集和对比学习合成方法Img-Diff,它专注于为多模态大语言模型(MLLMs)提升细粒度图像识别能力。这个方法通过分析相似图像之间的物体差异,挑战模型去识别匹配和不同的组成部分。例如,你有两张看起来非常相似的图片,但它们之间有一些细微的差别,比如一张图片中的物体被替换了。Img-... 阅读全文

    优惠 创新系统Sketch2Scene:根据用户的简单草图和文本提示,自动生成交互式的3D游戏场景

  • 创新系统Sketch2Scene:根据用户的简单草图和文本提示,自动生成交互式的3D游戏场景
    AI
  • 腾讯XR视觉实验室和澳大利亚国立大学的研究人员推出创新系统Sketch2Scene,它能够根据用户的简单草图和文本提示,自动生成交互式的3D游戏场景。这就像是给一个会魔法的画家,只需要随手画几笔和简单描述,就能创造出一个栩栩如生的游戏世界。例如,你想要创造一个游戏场景,但你可能不是专业的3D建模师。有了Sketch2S... 阅读全文

    优惠 交互式可视化工具TRANSFORMER EXPLAINER:帮助非专业人士通过GPT-2模型来学习理解Transformer这一文本生成模型

  • 交互式可视化工具TRANSFORMER EXPLAINER:帮助非专业人士通过GPT-2模型来学习理解Transformer这一文本生成模型
    AI
  • TRANSFORMER EXPLAINER是一个交互式可视化工具,它旨在帮助非专业人士通过GPT-2模型来学习理解Transformer这一文本生成模型。Transformer是一种在机器学习领域非常流行的神经网络架构,广泛应用于从文本到视觉的多种任务中。但Transformer的内部工作原理对许多人来说还是一个黑箱,... 阅读全文

    情报 迪士尼《星际宝贝》真人电影发布先导预告,将于2025 年夏季上映

  • 迪士尼《星际宝贝》真人电影发布先导预告,将于2025 年夏季上映
  • 迪士尼在今年 D23 活动中,公布了《星际宝贝》真人电影先导预告,并宣布该电影将于 2025 年夏季上映。该电影将由迪恩・弗雷斯彻-坎普(《穿鞋子的贝壳马塞尔》)执导,新人演员玛雅・凯洛哈将饰演莉萝,喜剧演员扎克・加利凡纳基斯将配音独眼霹雳。2002 年推出的动画片《星际宝贝》讲述孤独的夏威夷小女孩莉萝和看起来调皮捣蛋... 阅读全文

    情报 真人版《白雪公主》首曝预告,盖尔·加朵饰演毒皇后亮相

  • 真人版《白雪公主》首曝预告,盖尔·加朵饰演毒皇后亮相
  • 迪士尼《白雪公主》真人电影也在D23大会上亮相,并且公布了首支预告片。视频画面中,白雪公主、七个小矮人、邪恶皇后、魔镜、毒苹果等经典角色、道具都纷纷现身。该片由瑞秋·泽格勒(《饥饿游戏:鸣鸟与蛇之歌》)饰演白雪公主,“神奇女侠”盖尔·加朵饰演反派恶毒皇后,安德鲁·伯纳普(《继承》)饰演男主角、一个新角色。 马克·韦布(... 阅读全文

    百科 提高隐私!如何在Windows 11上启用浏览器的“禁止跟踪”功能

  • 提高隐私!如何在Windows 11上启用浏览器的“禁止跟踪”功能
  • 在 Windows系统上,几乎所有的浏览器,包括 微软 Edge浏览器、谷歌 Chrome浏览器等,都包含了“ 禁止跟踪(Do Not Track, DNT)”设置。这项功能可以帮助您向网站表明,您不希望自己的浏览行为被用于定向广告或分析。以下是如何在这些浏览器上启用“禁止跟踪”功能的步骤。 什么是“禁止跟踪”? “禁... 阅读全文

    优惠 跨平台开源快速启动工具Kando,多级饼状菜单、拖拽启动

  • 跨平台开源快速启动工具Kando,多级饼状菜单、拖拽启动
    工具
  • Kando 是一个跨平台的开源快速启动工具,支持 Windows、macOS、Linux,旨在提供一种非常规、快速且有趣的与计算机互动的方式。用户可以通过 Kando 来启动应用程序、模拟键盘快捷键、打开文件等多种操作。该项目支持鼠标、触控笔或触摸输入,特别适合那些频繁使用指尖与设备交互的用户。尽管如此,对于经常双手置... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?