优惠零样本音频分类ReCLAP：理解自然语言描述来识别不同类型的声音

AI

推荐人：暴走AI 标签：ReCLAP 零样本音频分类 AI

2年前 (2024-09-17)AI

马里兰大学帕克分校和Adobe Research的研究人员推出一种用于零样本音频分类（Zero-Shot Audio Classification, ZSAC）的方法ReCLAP。零样本音频分类是一种技术，可以让计算机在没有直接训练数据的情况下，通过理解 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠音频恢复模型Apollo：专门设计用于改善压缩音频的质量

AI

推荐人：暴走AI 标签：Apollo AI

2年前 (2024-09-16)AI

清华大学和腾讯AI实验室的研究人员推出音频恢复模型Apollo，它专门设计用于改善压缩音频的质量。例如，你正在听一首因为文件压缩而音质受损的歌曲，Apollo的目标就是让这首歌听起来尽可能地接近原始无损音质。项目 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 VMAS框架：能够从视频输入中学习生成背景音乐

AI

推荐人：暴走AI 标签：VMAS AI

2年前 (2024-09-12)AI

北卡罗来纳大学教堂山分校计算机科学系和字节跳动的研究人员推出VMAS框架，它能够从视频输入中学习生成背景音乐。与以往依赖于符号音乐注释（如 MIDI 文件）的方法不同，VMAS 利用了大规模的网络视频和伴随的背景音 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠视频生成音频系统Draw an Audio：根据视频内容自动生成与之匹配的声音效果

AI

推荐人：暴走AI 标签：Draw an Audio AI

2年前 (2024-09-11)AI

中国科学院自动化研究所和美团点评的研究人员推出视频生成音频系统Draw an Audio，这个系统能够根据视频内容自动生成与之匹配的声音效果，这在电影制作中被称为“Foley”艺术。例如，你给这个系统一段没有声音的视频， ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠歌曲生成系统SongCreator：能创作出一首包含旋律、伴奏和歌声的完整歌曲

AI

推荐人：暴走AI 标签：SongCreator AI

2年前 (2024-09-11)AI

清华大学深圳国际研究生院、香港中文大学的研究人员推出SongCreator，它是一个基于歌词生成完整歌曲的人工智能系统。想象一下，你给SongCreator提供一段歌词，它就能创作出一首包含旋律、伴奏和歌声的完整歌曲，就像 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠日本NTT推出声音转换技术FastVoiceGrad

AI

推荐人：暴走AI 标签：FastVoiceGrad AI

2年前 (2024-09-05)AI

日本NTT推出一种声音转换技术FastVoiceGrad，声音转换技术能够将一个人的声音转换成另一个人的声音，同时不改变语言内容。这项技术在多个领域都有潜在的应用价值，比如在语音合成、语音识别和娱乐产业中。例如，你正 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠基于扩散模型和Transformer架构的新型音乐生成模型FluxMusic

AI

推荐人：暴走AI 标签：FluxMusic 音乐生成模型 AI

2年前 (2024-09-04)AI

昆仑万维推出新型音乐生成模型FluxMusic，它基于扩散模型和Transformer架构，能够根据文本描述生成音乐。这个模型特别之处在于它使用了一种称为“修正流（Rectified Flow）”的技术，以及在潜在的变分自编码器（VAE） ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型音频编码模型WavTokenizer：能够高效地将自然信号如语音、音乐和普通音频压缩成低维度的离散标记（tokens），以便于语言模型处理

AI

推荐人：暴走AI 标签：WavTokenizer AI

2年前 (2024-08-30)AI

浙江大学、阿里巴巴集团和Meta的研究人员推出新型音频编码模型WavTokenizer，它能够高效地将自然信号如语音、音乐和普通音频压缩成低维度的离散标记（tokens），以便于语言模型处理。简单来说，WavTokenizer就像是 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Audio Match Cutting：用于在电影和视频中自动寻找和创建匹配的音频过渡

AI

推荐人：暴走AI 标签：Audio Match Cutting AI

2年前 (2024-08-21)AI

杜比实验室和布法罗大学的研究人员推出Audio Match Cutting，它用于在电影和视频中自动寻找和创建匹配的音频过渡。这种技术特别关注音频的匹配剪辑，即在两个镜头之间实现声音的无缝过渡，让观众在听觉上感觉平滑自 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型高保真度、高效率的波形生成模型PeriodWave-Turbo：通过对抗性流匹配优化来加速生成高质量的波形信号

AI

推荐人：暴走AI 标签：PeriodWave-Turbo AI

2年前 (2024-08-16)AI

韩国亚洲大学的研究人员推出新型高保真度、高效率的波形生成模型PeriodWave-Turbo，它通过对抗性流匹配优化（Adversarial Flow Matching Optimization）来加速生成高质量的波形信号。想象一下，你想要制作一段音乐或 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠阿里通义千问开源语音交互大模型Qwen2-Audio 7B：自由互动，无需输入文本

AI

推荐人：暴走AI 标签：Qwen2-Audio 7B AI

2年前 (2024-08-13)AI

阿里通义千问开源 Qwen2-Audio 系列的两个模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。作为一个大规模音频语言模型，Qwen2-Audio 能够接受各种音频信号输入，并根据语音指令执行音频分析或直接响应文本，有两 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型高效Transformer模型AVESFormer：专为实时音视频分割任务而设计

AI

推荐人：暴走AI 标签：AVESFormer AI

2年前 (2024-08-07)AI

中国科学院大学人工智能学院、中国科学院自动化研究所和中国铁塔股份有限公司的研究人员推出新型高效Transformer模型AVESFormer，它专为实时音视频（Audio-Visual, AV）分割任务而设计。音视频分割是一种多模态任务 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

推荐类别

栏目分类

AI音频

优惠零样本音频分类ReCLAP：理解自然语言描述来识别不同类型的声音

优惠音频恢复模型Apollo：专门设计用于改善压缩音频的质量

优惠 VMAS框架：能够从视频输入中学习生成背景音乐

优惠视频生成音频系统Draw an Audio：根据视频内容自动生成与之匹配的声音效果

优惠歌曲生成系统SongCreator：能创作出一首包含旋律、伴奏和歌声的完整歌曲

优惠日本NTT推出声音转换技术FastVoiceGrad

优惠基于扩散模型和Transformer架构的新型音乐生成模型FluxMusic

优惠新型音频编码模型WavTokenizer：能够高效地将自然信号如语音、音乐和普通音频压缩成低维度的离散标记（tokens），以便于语言模型处理

优惠 Audio Match Cutting：用于在电影和视频中自动寻找和创建匹配的音频过渡

优惠新型高保真度、高效率的波形生成模型PeriodWave-Turbo：通过对抗性流匹配优化来加速生成高质量的波形信号

优惠阿里通义千问开源语音交互大模型Qwen2-Audio 7B：自由互动，无需输入文本

优惠新型高效Transformer模型AVESFormer：专为实时音视频分割任务而设计