阿里达摩院

优惠 阿里达摩院上线文本生成视频大模型:仅支持英文输入,已开放试玩

  • 阿里达摩院上线文本生成视频大模型:仅支持英文输入,已开放试玩
    工具
  • 阿里达摩院已在 AI 模型社区“魔搭”ModelScope 上线了“文本生成视频大模型”。目前文本生成视频大模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成,整体模型参数约 17 亿,目前仅支持英文输入。扩散模型采用 Unet3D 结构,通过从纯高斯噪声视频中,迭代去噪的... 阅读全文