AI
优惠 新型视频理解框架VideoLLaMB:专门设计来处理和理解长时间视频内容
标签:VideoLLaMB
AI
2年前 (2024-09-04)AI
北京通用人工智能研究院 (BIGAI)、美国加州大学圣克鲁斯分校计算机科学与工程系、北京大学王选计算机技术研究所和通用人工智能国家重点实验室的研究人员推出新型视频理解框架VideoLLaMB,这个框架专门设计来处理和理 ...... 阅读全文
优惠 CrossViewDiff:用于卫星图像到街景图像合成的跨视角扩散模型
标签:CrossViewDiff
AI
2年前 (2024-09-02)AI
中山大学、上海人工智能实验室和商汤科技的研究人员推出一个名为CrossViewDiff的模型,它是一个用于卫星图像到街景图像合成的跨视角扩散模型。简单来说,这个模型能够将从高空卫星拍摄的图像转换成仿佛在地面上拍摄 ...... 阅读全文
优惠 文本风格转换方法StyleRemix:能够将文本重新编写,以故意模糊作者的身份
标签:StyleRemix
AI
2年前 (2024-08-30)AI
华盛顿大学和艾伦人工智能研究所的研究人员推出文本风格转换方法StyleRemix,它能够将文本重新编写,以故意模糊作者的身份。这项技术对于保护作者隐私非常重要,尤其是在需要匿名讨论、双盲审稿或健康服务等敏感情境 ...... 阅读全文
优惠 新型音频编码模型WavTokenizer:能够高效地将自然信号如语音、音乐和普通音频压缩成低维度的离散标记(tokens),以便于语言模型处理
标签:WavTokenizer
AI
2年前 (2024-08-30)AI
浙江大学、阿里巴巴集团 和Meta的研究人员推出新型音频编码模型WavTokenizer,它能够高效地将自然信号如语音、音乐和普通音频压缩成低维度的离散标记(tokens),以便于语言模型处理。简单来说,WavTokenizer就像是 ...... 阅读全文













