当前位置：首页 > 优惠 >AI视频>文章详情

北大-兔展AIGC联合实验室共同发起Open-Sora计划，目标是复现OpenAI的Sora模型

推荐人：暴走AI| 商城: AI | 1年前 (2024-03-02)| 分类：AI视频 | 热度：431 ℃

已关闭评论

由北大-兔展AIGC联合实验室共同发起Open-Sora计划，目标是复现OpenAI的Sora模型。该计划通过结合视频VQ-VAE、Denoising Diffusion Transformer和条件编码器等关键技术组件，以实现Sora模型的核心功能。

项目主页与GitHub链接：

Open-Sora计划的核心组件：

实现细节：

可变长宽比：采用动态掩码策略，确保在保持灵活长宽比的同时进行批量训练。视频被下采样至最长边为256像素，并填充至256x256分辨率，以支持批量编码和注意力掩码去噪。
可变分辨率：尽管在固定的256x256分辨率上训练，但通过使用位置插值技术，可以实现可变分辨率采样。这使得模型能够处理更高分辨率的视频序列。
可变时长：利用VideoGPT中的Video VQ-VAE技术，支持变时长生成。同时，通过扩展空间位置插值至时空维度，实现对变时长视频的处理。

Open-Sora OpenAI Sora