推荐类别

栏目分类

优惠 TikTok文字转语音生成器,抖音热门配音一键搞定

  • TikTok文字转语音生成器,抖音热门配音一键搞定
    工具
  • 您是否在寻找一个简单快捷的方法,为TikTok视频添加配音?「TikTok文字转语音生成器」是您的理想选择。这是一款专为TikTok设计的免费工具,能够将文字内容迅速转换成自然流畅的语音音频。 主要特性: 免费使用:无需 ...... 阅读全文

    优惠 Logo Surf:免费在线文字Logo & Favicon生成器

  • Logo Surf:免费在线文字Logo & Favicon生成器
    工具
  • Logo Surf 是一款开源的在线工具,专门用于快速制作专业的文字Logo和Favicon。它以简洁的界面和直观的操作流程,帮助用户设计出既美观又专业的网站标志。 主要特点: 免费使用:无需花费,即可创建个性化的标志图案 ...... 阅读全文

    优惠 AI生成图像的水印技术的脆弱性,特别是它们在面对视觉改写攻击时的鲁棒性

  • AI生成图像的水印技术的脆弱性,特别是它们在面对视觉改写攻击时的鲁棒性
    AI
  • 这篇论文探讨了人工智能生成图像的水印技术的脆弱性,特别是它们在面对视觉改写攻击时的鲁棒性。随着文本到图像生成系统的快速发展,例如Stable Diffusion、Midjourney、Imagen和DALL-E等模型,人们对其可能被滥用的 ...... 阅读全文

    优惠 Audio Match Cutting:用于在电影和视频中自动寻找和创建匹配的音频过渡

  • Audio Match Cutting:用于在电影和视频中自动寻找和创建匹配的音频过渡
    AI
  • 杜比实验室和布法罗大学的研究人员推出Audio Match Cutting,它用于在电影和视频中自动寻找和创建匹配的音频过渡。这种技术特别关注音频的匹配剪辑,即在两个镜头之间实现声音的无缝过渡,让观众在听觉上感觉平滑自 ...... 阅读全文

    优惠 NeCo:用于改善预训练模型的空间表示能力,特别是在自监督学习环境中

  • NeCo:用于改善预训练模型的空间表示能力,特别是在自监督学习环境中
    AI
  • 阿姆斯特丹大学、 荷兰应用科学研究组织和奥地利科学技术研究所的研究人员推出新技术NeCo(Patch Neighbor Consistency),用于改善预训练模型的空间表示能力,特别是在自监督学习环境中。NeCo通过对学生和教师模型 ...... 阅读全文

    优惠 新技术SpaRP:能够从稀疏视角的二维图像中快速重建出三维物体,并估计它们的相对姿态

  • 新技术SpaRP:能够从稀疏视角的二维图像中快速重建出三维物体,并估计它们的相对姿态
    AI
  • 加州大学圣地亚哥分校、Hillbot 、 浙江大学和加州大学洛杉矶分校的研究人员推出新技术SpaRP(Sparse-view Reconstruction and Pose estimation),它能够从稀疏视角的二维图像中快速重建出三维物体,并估计它们的相 ...... 阅读全文

    优惠 高效光学流估计方法NeuFlow v2:能够在边缘设备上实现实时高精度的光学流计算

  • 高效光学流估计方法NeuFlow v2:能够在边缘设备上实现实时高精度的光学流计算
    AI
  • 高效光学流估计方法NeuFlow v2,它能够在边缘设备上实现实时高精度的光学流计算。光学流是计算机视觉中的一个概念,用于描述图像中物体运动的模式,这在自动驾驶、机器人导航、增强现实等领域有着重要应用。例如,在 ...... 阅读全文

    优惠 新型视觉模型MM-SAM:处理多种传感器数据,进行鲁棒且准确的场景分割

  • 新型视觉模型MM-SAM:处理多种传感器数据,进行鲁棒且准确的场景分割
    AI
  • 新加坡南洋理工大学、日本东京大学、RIKEN AIP和日本奈良科学技术大学的研究人员推出新型视觉模型MM-SAM(Multi-Modal Segment Anything Model),它能够处理多种传感器数据,进行鲁棒且准确的场景分割。场景分割是 ...... 阅读全文

    优惠 新型3D重建模型MeshFormer:通过少量的多视角RGB图像和它们的法线图作为输入,快速生成具有精细几何细节的高质量3D纹理网格

  • 新型3D重建模型MeshFormer:通过少量的多视角RGB图像和它们的法线图作为输入,快速生成具有精细几何细节的高质量3D纹理网格
    AI
  • 加州大学圣地亚哥分校、Hillbot 、 浙江大学和加州大学洛杉矶分校的研究人员推出新型3D重建模型MeshFormer,它能够通过少量的多视角RGB图像和它们的法线图作为输入,快速生成具有精细几何细节的高质量3D纹理网格。简 ...... 阅读全文

    优惠 为处理长视频内容而设计的多模态视觉语言模型LongVILA

  • 为处理长视频内容而设计的多模态视觉语言模型LongVILA
    AI
  • 英伟达、麻省理工学院、加州大学伯克利分校和德克萨斯大学奥斯汀分校的研究人员推出LongVILA系统,它是一个为处理长视频内容而设计的多模态视觉语言模型。例如,我们有一段非常长的视频,比如一场足球比赛或者一个长 ...... 阅读全文

    百科 黑屏、闪退,玩不了《黑神话:悟空》?试试这些方法解决你的困扰!

  • 黑屏、闪退,玩不了《黑神话:悟空》?试试这些方法解决你的困扰!
  • 由游戏科学精心打造的动作RPG《黑神话:悟空》昨天发售后火爆全网,荣登Steam热销榜首位。游戏开放预下载后,在Steam平台上创下每秒70TB的使用频宽高峰。正式上线后,一小时内玩家数量即突破100万,晚间更达到了220 ...... 阅读全文

    情报 OpenAI宣布GPT-4o 微调功能开放,助力开发者提升应用性能

  • OpenAI宣布GPT-4o 微调功能开放,助力开发者提升应用性能
  • OpenAI宣布,开发者们期待已久的 GPT-4o 微调功能今日正式上线!同时,开发者将享受每天100万个训练Token的免费额度,直至9月23日。 开发者现在可以使用自定义数据集对GPT-4o进行微调,以更低的成本获得针对特定用例 ...... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?