优惠 评估平台K-Sort Arena:专门用来测试和比较生成模型的性能
标签:K-Sort Arena
AI
9个月前 (08-28)AI
中国科学院自动化研究所和加州大学伯克利分校的研究人员推出评估平台K-Sort Arena,它专门用来测试和比较生成模型的性能。你可以把生成模型想象成一位艺术家,它可以根据给定的文字描述创作出图片或视频。但就像评价艺术品一样,我们需要一种方法来评估这些艺术家的作品质量,这就是K-Sort Arena发挥作用的地方。 项目... 阅读全文
优惠 开源字幕时间轴调整工具subtitle-ass-shifter
9个月前 (08-27)工具
subtitle-ass-shifter是一个开源的SubStation Alpha(简称ASS)字幕时间轴调整工具。它允许用户通过简单的命令行界面来移动和调整ASS字幕文件的时间轴,以适应视频中的时间变化。该工具适用于需要对字幕进行精确时间调整的场景,例如电影、电视剧的字幕制作或视频编辑过程中的字幕同步调整。 功能特... 阅读全文
优惠 多模态大语言模型基准评测MME-RealWorld:现实世界高分辨率场景下的性能评估
标签:MME-RealWorld
AI
9个月前 (08-26)AI
中科院人工智能研究所、南京大学、香港科技大学、南洋理工大学、中科院大学、松鼠AI和Meta AI的研究人员推出多模态大语言模型基准MME-RealWorld,在现实世界高分辨率场景下的性能评估。简单来说,就是研究当这些智能模型面对真实世界中的复杂图像和问题时,它们的表现如何。 项目主页:https://mme-real... 阅读全文
优惠 从单一文本提示生成全视角可探索全景三维场景的新型框架LayerPano3D
标签:LayerPano3D
AI
9个月前 (08-26)AI
上海交通大学、香港中文大学、浙江大学、上海人工智能实验室、斯坦福大学和南洋理工大学的研究人员推出LayerPano3D,这是一种从单一文本提示生成全视角可探索全景三维场景的新型框架。我们的核心见解是将参考二维全景图分解为不同深度级别的多个图层,每个图层通过扩散先验揭示参考视图中看不见的空间。LayerPano3D 包含... 阅读全文
优惠 构建和深入理解视觉-语言模型!Hugging Face推出理解视觉-语言模型Idefics3-8B
9个月前 (08-26)AI
Hugging Face发布论文,论文的主题是关于构建和深入理解视觉-语言模型(VLMs)。VLMs是一种人工智能模型,它们能够处理和理解图像和文本,然后将这些信息综合起来输出文本。简单来说,这些模型就像一个能够“看”图片并“写”出描述的智能系统。它们还推出了Idefics3-8B,这是一个强大的VLM,它在开放数据集... 阅读全文
优惠 喜加一 Steam平台限时免费领取横向动作射击游戏《Weapon of Choice DX》 0元
9个月前 (08-24)Steam
独立游戏工作室 Mommy's Best Games 开发的横向动作射击游戏《Weapon of Choice DX》现正于 Steam 平台展开限时免费活动。只需登录 Steam 前往游戏的商店页面领取,即可将其永久保存至您的游戏库中。本次限免活动将持续到 9 月 22 日下午 12:00,请不要错过这个机会! 关于... 阅读全文