AI语音

优惠 新型零样本(Zero-Shot)语音合成系统FlashSpeech

  • 新型零样本(Zero-Shot)语音合成系统FlashSpeech
    AI
  • 来自香港科技大学、MSRA、萨里大学、内蒙古大学、北京邮电大学和新加坡国立大学的研究人员推出新型零样本(Zero-Shot)语音合成系统FlashSpeech,零样本语音合成是指在没有特定说话人数据训练的情况下,能够模仿该说话人的声音来生成语音的技术。这项技术可以应用于多种场景,比如为电影角色配音、创建个性化的虚拟助手... 阅读全文

    优惠 昆仑万维推出新型音乐生成模型MusicCM

  • 昆仑万维推出新型音乐生成模型MusicCM
    AI
  • 昆仑万维推出新型音乐生成模型Music Consistency Models(MusicCM),MusicCM的目标是提高音乐生成的效率和质量,它借鉴了图像和视频生成中常用的一致性模型(consistency models)的概念,以更少的采样步骤高效地合成音乐片段。 主要功能和特点: 高效音乐生成:MusicCM能够... 阅读全文

    优惠 轻量级的文本到语音(TTS)模型Parler-TTS,能够生成具有特定说话者风格(性别、音高、说话方式等)的高质量、自然听起来的语音

  • 轻量级的文本到语音(TTS)模型Parler-TTS,能够生成具有特定说话者风格(性别、音高、说话方式等)的高质量、自然听起来的语音
    AI
  • Parler-TTS 是一个轻量级的文本到语音(TTS)模型,能够生成具有特定说话者风格(性别、音高、说话方式等)的高质量、自然听起来的语音。这个模型是 Stability AI 和爱丁堡大学 Dan Lyth 和 Simon King 两位作者在论文 "Natural language guidance of hig... 阅读全文

    优惠 Stability AI发布Stable Audio 2.0技术论文

  • Stability AI发布Stable Audio 2.0技术论文
    AI
  • Stability AI之前推出Stable Audio 2.0,只需要一句提示词,即可生成长达三分钟的44.1 kHz立体声、结构连贯且音质上乘的完整曲目,还支持音频到音频转换能力,以及上传任意音乐对其进行风格转换。官方在昨天发布该模型的技术论文,由Stability A通过训练一个基于扩散变换器(diffusion... 阅读全文

    优惠 Suno的竞争对手出现了!前谷歌 DeepMind创立的Udio正式上线,免费用户每月可以生成1200首歌

  • Suno的竞争对手出现了!前谷歌 DeepMind创立的Udio正式上线,免费用户每月可以生成1200首歌
    AI
  • Suno的竞争对手出现了!由前谷歌 DeepMind 的领先 AI 研究员和工程师创立的Udio正式上线,目前处于免费测试阶段,用户每月可以生成1200首歌。相比Suno,Udio生成的歌曲时长更长,人声更加优质,偏向于模仿真实的歌手。不过目前由于使用人数过多,网站处于报错状态,大家可以明后天再进行测试。 官方介绍: ... 阅读全文

    优惠 新型文本到语音(TTS)合成方法RALL-E

  • 新型文本到语音(TTS)合成方法RALL-E
    AI
  • 来自微软、 东京大学、浙江大学、中国科学技术大学、香港中文大学和香港中文大学(深圳)的研究人员推出新型文本到语音(TTS)合成方法RALL-E,它通过改进语音的音调和时长预测,以及增强模型对音素的关注,从而生成更加准确和自然的语音输出。想象一下,你有一段文字,想要让它变成流畅自然的语音,就像有人在朗读一样。RALL-E... 阅读全文

    优惠 先进语音合成模型VOICECRAFT:在不需要任何额外文本的情况下,对语音进行编辑和合成

  • 先进语音合成模型VOICECRAFT:在不需要任何额外文本的情况下,对语音进行编辑和合成
    AI
  • 来自德克萨斯大学奥斯汀分校和Rembrand的研究团队推出先进语音合成模型VOICECRAFT,它能够在不需要任何额外文本的情况下,对语音进行编辑和合成,这被称为零样本文本到语音(TTS)任务。想象一下,你有一段录音,想要改变里面的某些词语或者语调,而不需要重新录制整个句子,VOICECRAFT就能够做到这一点。同样,... 阅读全文

    优惠 Stable Audio 2.0:只需一句提示词,即可生成长达三分钟的音乐

  • Stable Audio 2.0:只需一句提示词,即可生成长达三分钟的音乐
    AI
  • Stability AI在今天推出Stable Audio 2.0,只需要一句提示词,即可生成长达三分钟的44.1 kHz立体声、结构连贯且音质上乘的完整曲目,还支持音频到音频转换能力,以及上传任意音乐对其进行风格转换。目前免费用户可生成10首歌曲,不过从听感来说,生成的歌曲并不如Suno的好听,Stable Audi... 阅读全文

    优惠 200多位音乐人联名呼吁:停止AI对音乐创作的滥用,保护人类创造力!

  • 200多位音乐人联名呼吁:停止AI对音乐创作的滥用,保护人类创造力!
    AI
  • 随着各种AI音乐生成器的不断涌现,尤其是Suno 3.0的惊艳问世,许多音乐人感受到了前所未有的压力。近期,国外200多位知名音乐人联名签署了一封公开信,强烈呼吁停止AI对人类创造力的侵害,并保护艺术家免受其掠夺性使用的伤害。 这封公开信的签名者横跨多个音乐流派和时代,既包括Billie Eilish、J Balvin... 阅读全文

    优惠 非官方的Suno AI  API开源项目Suno AI API

  • 非官方的Suno AI  API开源项目Suno AI API
    AI
  • Suno AI API是一个非官方的Suno AI  API开源项目,用 API 调用 suno.ai 的音乐生成AI,并且可以轻松集成到 GPTs 等 agent 中。 特点: 完美的实现了 app.suno.ai 中的创作 API 支持 Custom Mode 一键部署到 vercel 除了标准 API,还适配了 ... 阅读全文

    优惠 Suno发布文生音乐模型v3:可在几秒钟内创建完整的两分钟歌曲

  • Suno发布文生音乐模型v3:可在几秒钟内创建完整的两分钟歌曲
    AI
  • AI音乐生成创企Suno发布文生音乐模型v3,该模型可在几秒钟内创建完整的两分钟歌曲。该工具可以通过其免费的独立网站访问,也可以通过启用Suno的第三方插件Microsoft Copilot访问。 Suno官方介绍: 在Suno,我们致力于打造一个每个人都能轻松创作音乐的未来。不论何时何地,只需几句简短的话语,你就可以... 阅读全文

    优惠 Adobe推出新型高保真立体声音码器MusicHiFi

  • Adobe推出新型高保真立体声音码器MusicHiFi
    AI
  • Adobe推出一个名为MusicHiFi的新型高保真立体声音码器(vocoder)。声音码器是一种可以将音乐的图像表示(例如梅尔频谱图)转换为音频波形的技术。现有的大多数声音码器通常只能生成较低分辨率的单声道音频(例如16-24 kHz),这限制了它们的效果。MusicHiFi通过使用一系列生成对抗网络(GANs)来改... 阅读全文