优惠新型视频预训练方法SIGMA：通过一种特别的方式来学习视频数据的表示，以便让计算机能够更好地理解和处理视频内容

AI

推荐人：暴走AI 标签：Sigma AI

1年前 (2024-07-24)AI

阿姆斯特丹大学推出一种新型的视频预训练方法，名为SIGMA（Sinkhorn-Guided Masked Video Modeling）。这个方法的核心是通过一种特别的方式来学习视频数据的表示，以便让计算机能够更好地理解和处理视频内容。SIGMA方法就像是换了一种学习方式，它让计算机学习如何把视频分成一个个小块，然后教... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠三维人体与物体交互F-HOI：能够理解和生成与人类与物体交互相关的精细描述

AI

推荐人：暴走AI 标签：F-HOI AI

1年前 (2024-07-24)AI

北京通用人工智能研究院和北京大学人工智能研究院的研究人员推出新模型F-HOI，它能够理解和生成与人类与物体交互相关的精细描述。主要是三维人体与物体交互（3D Human-Object Interaction, HOI）的精细语义对齐问题。想象一下，你有一个虚拟助手，能够观察一个人在视频中如何拿起一个瑜伽垫，然后不仅能... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠全新基准测试工具T2V-CompBench：用于评估文本到视频（Text-to-Video, T2V）生成模型的性能

AI

推荐人：暴走AI 标签：T2V-CompBench AI

1年前 (2024-07-24)AI

香港大学、香港中文大学和华为诺亚方舟实验室的研究人员推出全新基准测试工具T2V-CompBench，它专门用于评估文本到视频（Text-to-Video, T2V）生成模型的性能。T2V模型需要根据这个描述生成一段视频。但T2V-CompBench不仅测试模型能否生成视频，更重要的是测试它是否能够准确地组合多个对象、属... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 “诊断链（CoD）”：解决了大语言模型在医疗诊断领域中可解释性的问题

AI

推荐人：暴走AI 标签：CoD 诊断链 AI

1年前 (2024-07-24)AI

深圳市大数据研究院和香港中文大学（深圳）的研究人员引入“诊断链”（CoD）的概念，解决了大语言模型在医疗诊断领域中可解释性的问题。CoD将诊断过程转化为一个模仿医生思维流程的诊断链条，从而提供了一条清晰的推理路径。此外，CoD还能输出疾病确信度分布，确保决策过程的透明度。 GitHub：https://github.c... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新游发售手游转型PC！韩国开发商nStarcube旗下海洋动作冒险游戏《游泳少女黛西》登陆Steam 22.1元

STEAM

推荐人：暴走AI 标签：游泳少女黛西 STEAM

1年前 (2024-07-24)Steam

韩国开发商nStarcube将其手游力作《游泳少女黛西（DAISY THE SWIMMER）》搬上PC平台，在Steam上正式发布。尽管首日评价褒贬不一，但这款海洋动作冒险游戏以其独特的搞笑海边打斗和养眼夏日风情，迅速成为夏季的一道亮丽风景。游戏还特别支持繁体中文字幕与界面，满足中文玩家的需求。海滩上的冒险故事游戏... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠在线工具CachedView：帮助用户快速查找和访问网页的备份或历史快照

工具

推荐人：暴走AI 标签：CachedView 快照工具

1年前 (2024-07-24)工具

CachedView是一款非常实用的在线工具，它可以帮助用户快速查找和访问网页的备份或历史快照。通过将目标网址输入到CachedView的搜索框中，用户可以立即获取该网页在多个快照服务上的备份，包括但不限于： Google页面快照：Google搜索引擎通常会为每个索引的网页保存一个快照，CachedView可以帮你找到... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Notion离线替代方案？开源离线的个人知识管理工具Eidos ，在一处管理你的所有个人数据

工具

推荐人：暴走AI 标签：Eidos 工具

1年前 (2024-07-24)在线工具

Eidos 是一个开源的个人数据管理框架，旨在作为一个一站式解决方案，帮助用户管理和组织个人的所有数据。该项目由开发者 Mayneyao 主持，使用 TypeScript 编写，遵循 GNU Affero General Public License v3.0 许可证。Eidos 的主要特点在于它的离线可用性、与大语言... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型文本检索基准测试BRIGHT：用来评估和挑战检索系统在处理复杂查询时的表现

AI

推荐人：暴走AI 标签：BRIGHT AI

1年前 (2024-07-22)AI

香港大学、普林斯顿大学、华盛顿大学和Google Cloud AI 研究的研究人员推出新型文本检索基准测试BRIGHT，它专门设计用来评估和挑战检索系统在处理复杂查询时的表现。这些查询不仅需要关键词匹配，还需要深入的推理能力来识别相关文档。简单来说，BRIGHT测试的是检索系统是否能够“理解”查询背后的逻辑和上下文，... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠多模态大语言模型评估框架MultiTrust

AI

推荐人：暴走AI 标签：MultiTrust AI

1年前 (2024-07-22)AI

清华大学、北京航空航天大学、上海交通大学和RealAI的研究人员推出多模态大语言模型评估框架MultiTrust。简单来说，就是研究这些能够同时处理文本和图像等多种形式信息的人工智能模型是否值得信赖。这包括了它们在面对各种任务时的准确性、安全性、鲁棒性、公平性和隐私保护能力。项目主页：https://multi-tr... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Streetscapes：通过大规模一致性的街景生成技术，从少量图像中生成连贯的城市街景视图

AI

推荐人：暴走AI 标签：Streetscapes 城市街景视图 AI

1年前 (2024-07-22)AI

Google 研究和斯坦福大学的研究人员推出Streetscapes，即通过大规模一致性的街景生成技术，从少量图像中生成连贯的城市街景视图。这项技术可以用于从单一视频生成动态场景的三维重建和新视角合成。简单来说，就是利用几张街景图片和一些文本描述，计算机能够自动生成一段连续的、逼真的城市街道视频，展示出街道随着时间和天... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Shape of Motion：从单一视频重建动态场景的四维（4D）结构

AI

推荐人：暴走AI 标签：Shape of Motion AI

1年前 (2024-07-22)AI

加州大学伯克利分校和 Google 研究的研究人员推出Shape of Motion，从单一视频重建动态场景的四维（4D）结构。这项技术旨在从一段普通的单眼（即从一个视角）视频中恢复出场景的三维（3D）几何结构和随时间变化的运动轨迹。简单来说，就是让计算机能够从一段视频中理解物体的形状和它们是如何移动的。项目主页：h... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 3D重建技术SparseCraft：从少量彩色图像中恢复出3D形状和视角依赖的外观，实现高效的3D重建和新视角合成

AI

推荐人：暴走AI 标签：SparseCraft AI

1年前 (2024-07-22)AI

来自法国的团队推出一种新颖的3D重建技术，名为SparseCraft。这项技术能够从少量彩色图像中恢复出3D形状和视角依赖的外观，实现高效的3D重建和新视角合成。简单来说，就是通过几张图片来构建一个物体的三维模型，并能在不同视角下生成逼真的图像。例如，你是一名建筑师，需要将一个古老的建筑转换成3D模型以进行翻新设计。使... 阅读全文

直达链接好 0 不好 0 已关闭评论