AI语音

优惠 Suno发布文生音乐模型v3:可在几秒钟内创建完整的两分钟歌曲

  • Suno发布文生音乐模型v3:可在几秒钟内创建完整的两分钟歌曲
    AI
  • AI音乐生成创企Suno发布文生音乐模型v3,该模型可在几秒钟内创建完整的两分钟歌曲。该工具可以通过其免费的独立网站访问,也可以通过启用Suno的第三方插件Microsoft Copilot访问。 Suno官方介绍: 在Suno,我们致力于打造一个每个人都能轻松创作音乐的未来。不论何时何地,只需几句简短的话语,你就可以... 阅读全文

    优惠 Adobe推出新型高保真立体声音码器MusicHiFi

  • Adobe推出新型高保真立体声音码器MusicHiFi
    AI
  • Adobe推出一个名为MusicHiFi的新型高保真立体声音码器(vocoder)。声音码器是一种可以将音乐的图像表示(例如梅尔频谱图)转换为音频波形的技术。现有的大多数声音码器通常只能生成较低分辨率的单声道音频(例如16-24 kHz),这限制了它们的效果。MusicHiFi通过使用一系列生成对抗网络(GANs)来改... 阅读全文

    优惠 Image to Music V2:AI将图片转化为音乐,全新体验等你来

  • Image to Music V2:AI将图片转化为音乐,全新体验等你来
    AI
  • Image to Music V2是一个创新的服务,它通过AI技术将图片转化为音乐。上传你的照片后,系统会智能分析并为你生成一段与图片内容相匹配的音乐。 服务流程简单易懂 Image to Music V2结合了图像识别、自然语言处理以及音乐创作三大AI技术,为用户提供了一种新颖的体验。 1. 图像辨识:解读图片内涵 ... 阅读全文

    优惠 阿里大模型产品“通义听悟”发布新功能,音视频问答助手“小悟”惊艳上线

  • 阿里大模型产品“通义听悟”发布新功能,音视频问答助手“小悟”惊艳上线
    AI
  • 阿里大模型产品“通义听悟”今日迎来重磅更新,全新功能强势登场!其中最引人注目的莫过于音视频问答助手“小悟”的上线,它首次在业界实现了单记录、跨记录、多语言自由问,支持对单个最长6小时、一次性上百条音视频的内容理解问答。 🎉新功能亮点🎉 1️⃣ 音视频问答助手“小悟”:让你对超长音视频随心提问,小悟将为你总结任意知识点。... 阅读全文

    优惠 微软推出独立 AI 工具“阅读教练(Reading Coach)”,辅助提高学习者阅读能力,免费的英文发音训练工具

  • 微软推出独立 AI 工具“阅读教练(Reading Coach)”,辅助提高学习者阅读能力,免费的英文发音训练工具
    AI
  • 微软近日推出了一个名为“阅读教练(Reading Coach)”的新一代生成式 AI 教育工具,专门针对学生群体设计,旨在通过个性化的趣味练习来增强学习者的阅读技能。这款工具对用户免费开放,只需登录微软账号,无论是在校内还是家庭环境中都可轻松使用。Reading Coach 最初是集成在 Microsoft Teams... 阅读全文

    优惠 文本到语音(TTS)合成系统NaturalSpeech 3:生成自然、高质量且具有零样本(zero-shot)能力的语音

  • 文本到语音(TTS)合成系统NaturalSpeech 3:生成自然、高质量且具有零样本(zero-shot)能力的语音
    AI
  • 来自微软亚洲研究院、中国科学技术大学、香港中文大学(深圳)、浙江大学、东京大学、北京大学的研究人员推出文本到语音(TTS)合成系统NaturalSpeech 3。这个系统的目标是生成自然、高质量且具有零样本(zero-shot)能力的语音。所谓零样本能力,意味着即使在没有特定说话人的训练数据的情况下,系统也能够模仿他们... 阅读全文

    优惠 AI音乐生成工具Riff:你的音乐创作神器

  • AI音乐生成工具Riff:你的音乐创作神器
    AI
  •  Riff是一款AI音乐生成工具,可以选择风格、乐器,再书写提示词生成音乐,生成的音乐可用于视频、播客的BGM使用。 为什么选择Riff? 尖端的AI技术:Riff采用最新的AI技术,将您的创意迅速转化为美丽且无版权费用的音乐,完美融入您的项目中。 高清音乐库:沉浸在高质量的音乐世界中,无需担心版权或许可问题,为您的创... 阅读全文

    优惠 一种新颖的音乐风格转换方法:利用了扩散模型和时间变化的文本反演技术

  • 一种新颖的音乐风格转换方法:利用了扩散模型和时间变化的文本反演技术
    AI
  • 来自中国科学院自动化研究所、中国科学院大学人工智能学院、中国科学院计算技术研究所和快手的研究人员提出一种新颖的音乐风格转换方法,它利用了扩散模型和时间变化的文本反演技术。这种方法可以有效地捕捉音乐属性,即使在数据量很少的情况下也能实现。它通过一个创新的时间变化文本反演模块来精确捕捉不同层次的梅尔频谱图特征,并在推理过程... 阅读全文

    优惠 亚马逊推出10亿参数文本转语音模型BASE TTS

  • 亚马逊推出10亿参数文本转语音模型BASE TTS
    AI
  • 亚马逊团队于2月12日推出一个名为BASE TTS(Big Adaptive Streamable TTS with Emergent abilities)的文本转语音(TTS)模型,BASE TTS是目前已知最大的TTS模型,它在100,000小时的公共领域语音数据上进行了训练,实现了前所未有的语音自然度。这个模型采... 阅读全文

    优惠 借助英特尔免费OpenVINO AI插件包,Audacity 现已获得 AI 音频编辑功能

  • 借助英特尔免费OpenVINO AI插件包,Audacity 现已获得 AI 音频编辑功能
    AI
  • 作为一款广受赞誉的跨平台免费开源音频编辑软件Audacity,因其开放源码的特性吸引了全球开发者共同参与改进与创新。近期,英特尔为Audacity用户推出了一款专为音乐编辑和播客制作人打造的免费OpenVINO AI插件包,该插件在Intel的GitHub页面上提供下载,大小约为2GB,并且要求运行环境为64位Wind... 阅读全文

    优惠 革新语音笔记体验的开源GPT工具notesGPT:将语音记录、智能转录和任务管理融为一体

  • 革新语音笔记体验的开源GPT工具notesGPT:将语音记录、智能转录和任务管理融为一体
    GitHub
  • 开源的语音笔记GPT工具notesGPT,它将语音记录、智能转录和任务管理融为一体,为用户带来全新的高效率笔记体验。这款工具充分利用了最新的自然语言处理技术,不仅让语音转文字变得轻而易举,还能智能化地提炼信息并生成行动清单,且完全免费并对社区开放源代码。不论是日常的工作规划还是学术研究,它都将成为您不可或缺的得力助手。... 阅读全文

    优惠 你的声音能赚钱?ElevenLabs带你开启声音变现之旅!

  • 你的声音能赚钱?ElevenLabs带你开启声音变现之旅!
    AI
  • 美国AI语音初创公司 ElevenLabs革新配音行业,你的声音也可以赚钱了!现在只需在ElevenLabs旗下的VoiceLab上传30分钟个人音频样本,即可创建并分享您的专属AI声音模型至ElevenLabs的声音库,并在用户使用时获得收益。操作步骤非常简单: 登录VoiceLab页面,上传至少30分钟的高质量音频... 阅读全文