AI视频

优惠 新基准测试TC-Bench:用来评估和比较不同的视频生成模型在处理时间维度上组合性的能力

  • 新基准测试TC-Bench:用来评估和比较不同的视频生成模型在处理时间维度上组合性的能力
    AI
  • 加州大学圣巴巴拉分校和滑铁卢大学的研究人员推出新基准测试TC-Bench,它专门用来评估和比较不同的视频生成模型在处理时间维度上组合性的能力。这里的“时间组合性”意味着视频中的物体或者场景能够随着时间变化而展现出新的概念和它们之间的关系转换。例如,我们想要制作一个视频,视频里有一个变色龙从绿色变成蓝色。这个过程不是突变... 阅读全文

    优惠 美图影像节发布AI短片创作工具MOKI,支持多种视频场景创作

  • 美图影像节发布AI短片创作工具MOKI,支持多种视频场景创作
    AI
  • 美图公司举办了第三届美图影像节,主题为“聊聊AI工作流”,现场发布了多款AI影像工具。美图创始人吴欣鸿曾指出Sora给行业带来心理冲击,美图致力于AI原生应用的创新。MOKI作为AI短片创作工具,可实现内容和成本的双重可控,支持多种视频场景创作。 MOKI功能特点 脚本、视觉风格、角色设定后,AI自动生成分镜图并转换为... 阅读全文

    优惠 Luma AI推出AI视频生成项目Dream Machine,挑战OpenAI的Sora

  • Luma AI推出AI视频生成项目Dream Machine,挑战OpenAI的Sora
    AI
  • 今年初,OpenAI的Sora服务以其生成式AI视频技术震撼市场。本周,旧金山的Luma AI公司也宣布推出类似的AI视频服务——Dream Machine。Luma AI成立于2021年,由柏克莱大学的AI研究人员Alex Yu和前苹果Vision Pro开发人员Amit Jain联合创办。去年11月,该公司刚完成4... 阅读全文

    优惠 高质量视频-文本数据集Vript以及基于该数据集训练出的视频字幕生成模型Vriptor

  • 高质量视频-文本数据集Vript以及基于该数据集训练出的视频字幕生成模型Vriptor
    AI
  • 上海交通大学、 北京航空航天大学和小红书公司推出高质量视频-文本数据集Vript以及基于该数据集训练出的视频字幕生成模型Vriptor。Vript数据集包含12K高分辨率视频,这些视频被精心注释,提供了详细、密集且类似剧本的字幕,覆盖超过42万个片段。与以往的视频-文本数据集相比,Vript的每个片段都有大约145个词... 阅读全文

    优惠 ShareGPT4Video:提供密集且精确的字幕来改善大型视频-语言模型的视频理解能力和文本到视频模型的视频生成能力

  • ShareGPT4Video:提供密集且精确的字幕来改善大型视频-语言模型的视频理解能力和文本到视频模型的视频生成能力
    AI
  • 中国科学技术大学、香港中文大学、北京大学和上海人工智能实验室的研究人员推出ShareGPT4Video,旨在通过提供密集且精确的字幕来改善大型视频-语言模型(LVLMs)的视频理解能力和文本到视频模型(T2VMs)的视频生成能力。例如,你有一个AI助手,它不仅能看懂视频内容,还能根据视频内容生成详细的描述。这个助手就像... 阅读全文

    优惠 中国版Sora?快手推出自研视频生成大模型可灵大模型(Kling)

  • 中国版Sora?快手推出自研视频生成大模型可灵大模型(Kling)
    AI
  • 中国版Sora?快手推出自研视频生成大模型可灵大模型(Kling),可以生成2分钟的视频,目前处于测试阶段,需要下载APP申请加入候补名单。 以下是官方的介绍: 1️⃣大幅度的合理运动:可灵采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律。 2️⃣长达2分钟的视频... 阅读全文

    优惠 CamCo:相机控制的 3D 一致图像到视频生成

  • CamCo:相机控制的 3D 一致图像到视频生成
    AI
  • 德克萨斯大学奥斯汀分校和英伟达的研究人员推出新技术CamCo,它是一种可以生成视频的人工智能工具。总的来说,CamCo是一个强大的工具,它可以将静态图像转化为动态视频,并允许用户对摄像机的运动进行精确控制,创造出既真实又连贯的视频内容。例如,你有一张照片,但你想要的是一个视频,而不仅仅是静态的画面。CamCo可以帮助你... 阅读全文

    优惠 AI视频检测工具DeMamba:帮助区分真实视频和由AI生成的假视频,以应对假信息传播的问题

  • AI视频检测工具DeMamba:帮助区分真实视频和由AI生成的假视频,以应对假信息传播的问题
    AI
  • 蚂蚁集团、南京大学和上海交通大学的研究人员推出AI视频检测工具DeMamba以及一个大规模的AI生成视频数据集GenVideo。这个工具和数据集的主要目的是帮助区分真实视频和由AI生成的假视频,以应对假信息传播的问题。DeMamba和GenVideo数据集的推出,旨在提高AI生成视频检测技术的准确性和鲁棒性,以应对日益... 阅读全文

    优惠 文本引导的2D头像生成框架InstructAvatar:能够根据自然语言指令来控制头像的表情和动作

  • 文本引导的2D头像生成框架InstructAvatar:能够根据自然语言指令来控制头像的表情和动作
    AI
  • 北京大学的研究人员推出类似阿里的Emo和微软的VASA-1的文本引导的2D头像生成框架InstructAvatar,它能够根据自然语言指令来控制头像的表情和动作。简单来说,InstructAvatar就像是一个虚拟的“演员”,可以根据你给它的文本提示,展现出各种细腻的表情和动作。 项目主页:https://wangyu... 阅读全文

    优惠 Tele-Aloha:低成本、高真实感的双向远程存在(telepresence)系统

  • Tele-Aloha:低成本、高真实感的双向远程存在(telepresence)系统
    AI
  • 清华大学和京东方的研究人员推出Tele-Aloha,这是一款低成本、高真实感的双向远程存在(telepresence)系统。远程存在系统是一种通信技术,它能够让身处不同地点的人们感受到彼此仿佛在同一空间中。想象一下,你可以通过这种系统,与远在世界另一端的朋友或同事进行交流,就像他们真的坐在你旁边一样。 主要功能: Te... 阅读全文

    优惠 Awesome-Text-to-Video-Generation:AI视频生成项目收集列表

  • Awesome-Text-to-Video-Generation:AI视频生成项目收集列表
    AI
  • GitHub上的一个项目收集列表,以OpenAI的Sora为线索,对文本到视频领域的现有研究进行了全面的探索,并总结了该领域的24个数据集和9个评估指标。还发布论文梳理了文生视频的发展历程,结合Sora的优势和相关领域的特点,探讨了该研究领域及Sora本身存在的问题,并为未来的研究方向提供了建议。如果我们的工作能够给予... 阅读全文

    优惠 昆仑万维推出新型音乐生成模型MusicCM

  • 昆仑万维推出新型音乐生成模型MusicCM
    AI
  • 昆仑万维推出新型音乐生成模型Music Consistency Models(MusicCM),MusicCM的目标是提高音乐生成的效率和质量,它借鉴了图像和视频生成中常用的一致性模型(consistency models)的概念,以更少的采样步骤高效地合成音乐片段。 主要功能和特点: 高效音乐生成:MusicCM能够... 阅读全文