推荐类别

栏目分类

优惠 无需训练的视频大语言模型SlowFast-LLaVA:能够同时捕捉视频的细节空间语义和长时序时间上下文,而不会超出常用LLM的令牌预算

  • 无需训练的视频大语言模型SlowFast-LLaVA:能够同时捕捉视频的细节空间语义和长时序时间上下文,而不会超出常用LLM的令牌预算
    AI
  • 苹果推出一个名为SlowFast-LLaVA(简称SF-LLaVA)的新方法,它是一种无需训练的视频大语言模型(LLM)。SF-LLaVA能够同时捕捉视频的细节空间语义和长时序时间上下文,而不会超出常用LLM的令牌预算。这种方法通过为视 ...... 阅读全文

    优惠 CAS:用于四足机器人的导航系统,能够使机器人穿越复杂的3D地形到达目标位置

  • CAS:用于四足机器人的导航系统,能够使机器人穿越复杂的3D地形到达目标位置
    AI
  • 上海启智研究院、 浙江大学、上海交通大学和清华大学的研究人员推出创新系统“Cross Anything System”(简称CAS),它是一个用于四足机器人的导航系统,能够使机器人穿越复杂的3D地形到达目标位置。这个系统由一个高 ...... 阅读全文

    优惠 新型视频预训练方法SIGMA:通过一种特别的方式来学习视频数据的表示,以便让计算机能够更好地理解和处理视频内容

  • 新型视频预训练方法SIGMA:通过一种特别的方式来学习视频数据的表示,以便让计算机能够更好地理解和处理视频内容
    AI
  • 阿姆斯特丹大学推出一种新型的视频预训练方法,名为SIGMA(Sinkhorn-Guided Masked Video Modeling)。这个方法的核心是通过一种特别的方式来学习视频数据的表示,以便让计算机能够更好地理解和处理视频内容。SIGMA ...... 阅读全文

    优惠 三维人体与物体交互F-HOI:能够理解和生成与人类与物体交互相关的精细描述

  • 三维人体与物体交互F-HOI:能够理解和生成与人类与物体交互相关的精细描述
    AI
  • 北京通用人工智能研究院和 北京大学人工智能研究院的研究人员推出新模型F-HOI,它能够理解和生成与人类与物体交互相关的精细描述。主要是三维人体与物体交互(3D Human-Object Interaction, HOI)的精细语义对齐问题 ...... 阅读全文

    优惠 全新基准测试工具T2V-CompBench:用于评估文本到视频(Text-to-Video, T2V)生成模型的性能

  • 全新基准测试工具T2V-CompBench:用于评估文本到视频(Text-to-Video, T2V)生成模型的性能
    AI
  • 香港大学、香港中文大学和华为诺亚方舟实验室的研究人员推出全新基准测试工具T2V-CompBench,它专门用于评估文本到视频(Text-to-Video, T2V)生成模型的性能。T2V模型需要根据这个描述生成一段视频。但T2V-CompBenc ...... 阅读全文

    优惠 “诊断链(CoD)”:解决了大语言模型在医疗诊断领域中可解释性的问题

  • “诊断链(CoD)”:解决了大语言模型在医疗诊断领域中可解释性的问题
    AI
  • 深圳市大数据研究院和香港中文大学(深圳)的研究人员引入“诊断链”(CoD)的概念,解决了大语言模型在医疗诊断领域中可解释性的问题。CoD将诊断过程转化为一个模仿医生思维流程的诊断链条,从而提供了一条清晰的推理 ...... 阅读全文

    优惠 新游发售 手游转型PC!韩国开发商nStarcube旗下海洋动作冒险游戏《游泳少女黛西》登陆Steam 22.1元

  • 手游转型PC!韩国开发商nStarcube旗下海洋动作冒险游戏《游泳少女黛西》登陆Steam
    STEAM
  • 韩国开发商nStarcube将其手游力作《游泳少女黛西(DAISY THE SWIMMER)》搬上PC平台,在Steam上正式发布。尽管首日评价褒贬不一,但这款海洋动作冒险游戏以其独特的搞笑海边打斗和养眼夏日风情,迅速成为夏季的一道 ...... 阅读全文

    优惠 在线工具CachedView:帮助用户快速查找和访问网页的备份或历史快照

  • 在线工具CachedView:帮助用户快速查找和访问网页的备份或历史快照
    工具
  • CachedView是一款非常实用的在线工具,它可以帮助用户快速查找和访问网页的备份或历史快照。通过将目标网址输入到CachedView的搜索框中,用户可以立即获取该网页在多个快照服务上的备份,包括但不限于: Google页面 ...... 阅读全文

    优惠 Notion离线替代方案?开源离线的个人知识管理工具Eidos ,在一处管理你的所有个人数据

  • Notion离线替代方案?开源离线的个人知识管理工具Eidos ,在一处管理你的所有个人数据
    工具
  • Eidos 是一个开源的个人数据管理框架,旨在作为一个一站式解决方案,帮助用户管理和组织个人的所有数据。该项目由开发者 Mayneyao 主持,使用 TypeScript 编写,遵循 GNU Affero General Public License v3.0 许可证 ...... 阅读全文

    优惠 新型文本检索基准测试BRIGHT:用来评估和挑战检索系统在处理复杂查询时的表现

  • 新型文本检索基准测试BRIGHT:用来评估和挑战检索系统在处理复杂查询时的表现
    AI
  • 香港大学、 普林斯顿大学、华盛顿大学和Google Cloud AI 研究的研究人员推出新型文本检索基准测试BRIGHT,它专门设计用来评估和挑战检索系统在处理复杂查询时的表现。这些查询不仅需要关键词匹配,还需要深入的推理 ...... 阅读全文

    优惠 多模态大语言模型评估框架MultiTrust

  • 多模态大语言模型评估框架MultiTrust
    AI
  • 清华大学、北京航空航天大学、上海交通大学和RealAI的研究人员推出多模态大语言模型评估框架MultiTrust。简单来说,就是研究这些能够同时处理文本和图像等多种形式信息的人工智能模型是否值得信赖。这包括了它们在面 ...... 阅读全文

    优惠 Streetscapes:通过大规模一致性的街景生成技术,从少量图像中生成连贯的城市街景视图

  • Streetscapes:通过大规模一致性的街景生成技术,从少量图像中生成连贯的城市街景视图
    AI
  • Google 研究和斯坦福大学的研究人员推出Streetscapes,即通过大规模一致性的街景生成技术,从少量图像中生成连贯的城市街景视图。这项技术可以用于从单一视频生成动态场景的三维重建和新视角合成。简单来说,就是利 ...... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?