推荐类别

栏目分类

优惠 免费在线文字转语音(TTS)工具Luvvoice

  • 免费在线文字转语音(TTS)工具Luvvoice
    工具
  • Luvvoice 是一款免费的在线文字转语音(TTS)工具,它利用人工智能技术,特别是深度学习,来生成高质量、接近真实人类声音的语音文件。这类工具对于媒体制作、教育、游戏开发以及为视障人士提供无障碍服务等领域非常有用。以下是 Luvvoice 的一些特点: 广泛的语音选择:支持超过 70 种语言和 200 多种不同的语... 阅读全文

    情报 英伟达为其一站式Nvidia App发布了重要的beta版本更新:整合GeForce Experience和控制面板的功能

  • 英伟达为其一站式Nvidia App发布了重要的beta版本更新:整合GeForce Experience和控制面板的功能
  • 英伟达最新为其一站式Nvidia App发布了重要的beta版本更新。这款应用整合了GeForce Experience和控制面板的功能,现在用户可以通过一个统一的平台轻松管理(大多数功能使用时不需要登录)。 新特性概览 改进的显示设置:用户现在可以集中调整连接的显示器或电视的分辨率、刷新率和方向,轻松实现GPU的各项... 阅读全文

    情报 OpenAI发布最新AI模型GPT-4o-2024-08-06

  • OpenAI发布最新AI模型GPT-4o-2024-08-06
  • 昨日,OpenAI宣布推出了其最新型号的AI模型——GPT-4o-2024-08-06,这款新模型新增了结构化输出功能,这意味着通过API生成的内容将严格遵循开发者提供的JSON Schema格式。同时,OpenAI还下调了API的使用费用,新模型的输入Token价格降低了50%,输出Token价格也降低了33%。 今... 阅读全文

    百科 开源电脑硬件监控工具LibreHardwareMonitor,电脑硬件情况轻松查看!

  • 开源电脑硬件监控工具LibreHardwareMonitor,电脑硬件情况轻松查看!
  • LibreHardwareMonitor是一个开源的电脑硬件监控软件,此软件最初是基于另一款开源电脑硬件监控软件OpenHardware Monitor的一个分支,后来发展成为一个独立的、功能更加强大的硬件监控工具。LibreHardwareMonitor能够监测计算机内部的多种硬件参数,包括CPU温度、电压、风扇速度... 阅读全文

    情报 《黑神话:悟空》最终预告片公布:全新变身角色、剧情动画,四大天王亮相,8 月 20 日正式发售

  • 《黑神话:悟空》最终预告片公布:全新变身角色、剧情动画,四大天王亮相,8 月 20 日正式发售
  • 国产游戏 3A 大作《黑神话:悟空》将于 8 月 20 日正式发售,官方今日 10 点公布了最终预告片。据游戏科学官方消息,《黑神话:悟空》已经完成了正式版本所有内容的开发,将如期与大家见面。目前,项目全体成员仍在紧张进行着游戏上线前最后的体验、测试与部署工作。 九九归真道行难,坚持笃志立玄关。 必须苦练邪魔退,定要修... 阅读全文

    优惠 新型高效Transformer模型AVESFormer:专为实时音视频分割任务而设计

  • 新型高效Transformer模型AVESFormer:专为实时音视频分割任务而设计
    AI
  • 中国科学院大学人工智能学院、中国科学院自动化研究所和中国铁塔股份有限公司的研究人员推出新型高效Transformer模型AVESFormer,它专为实时音视频(Audio-Visual, AV)分割任务而设计。音视频分割是一种多模态任务,目的是在像素级别上区分出视频中与声音源相对应的物体。这项技术在机器人感知、视频监控... 阅读全文

    优惠 新技术框架ReSyncer:用于创建统一的音频-视觉同步的面部表演者的系统

  • 新技术框架ReSyncer:用于创建统一的音频-视觉同步的面部表演者的系统
    AI
  • 清华大学、百度公司、中关村实验室和南洋理工大学的研究人员推出新技术框架ReSyncer,它是一个用于创建统一的音频-视觉同步的面部表演者的系统。简单来说,ReSyncer能够根据给定的音频生成口型同步的视频,并且能够进一步传递目标人物的说话风格和身份特征。ReSyncer在不同方面的性能,包括与现有技术的比较、定量和定... 阅读全文

    优惠 新颖方法omages:用于生成逼真的3D模型和UV贴图,这个过程通过一种称为“对象图像”的表示来实现

  • 新颖方法omages:用于生成逼真的3D模型和UV贴图,这个过程通过一种称为“对象图像”的表示来实现
  • 西蒙菲莎大学和香港城市大学的研究人员推出新颖方法omages,用于生成逼真的3D模型和UV贴图,这个过程通过一种称为“对象图像”(Object Images)的表示来实现。简单来说,就是将复杂的3D形状转换成64x64像素的2D图像,这样做的好处是可以利用现有的图像生成模型,比如扩散变换器(Diffusion Tran... 阅读全文

    优惠 新型大型多模态模型LLaVA-OneVision:提高计算机视觉任务的性能,特别是在处理单图像、多图像和视频场景时的能力

  • 新型大型多模态模型LLaVA-OneVision:提高计算机视觉任务的性能,特别是在处理单图像、多图像和视频场景时的能力
    AI
  • 这篇论文介绍了一个名为LLaVA-OneVision的新型大型多模态模型(LMMs),它是由多个机构共同开发的,包括字节跳动、南洋理工大学、香港中文大学和香港科技大学。这个模型的核心目标是提高计算机视觉任务的性能,特别是在处理单图像、多图像和视频场景时的能力。例如,你正在使用一个智能助手,你给它发送了一张你在旅行中拍摄... 阅读全文

    优惠 评估基准测试MMIU:专门用于测试和评估大型视觉-语言模型在处理多图像任务时的性能

  • 评估基准测试MMIU:专门用于测试和评估大型视觉-语言模型在处理多图像任务时的性能
    AI
  • 上海人工智能实验室、上海交通大学、香港大学、商汤科技研究部和清华大学的研究人员推出评估基准测试MMIU(Multimodal Multi-image Understanding),它专门用于测试和评估大型视觉-语言模型(LVLMs)在处理多图像任务时的性能。简单来说,MMIU是一个全面的测试套件,它可以检验这些模型是否... 阅读全文

    优惠 ExoViP系统:用于组合视觉推理的验证和探索工具

  • ExoViP系统:用于组合视觉推理的验证和探索工具
    AI
  • 北京国家通用人工智能重点实验室和约翰霍普金斯大学的研究人员推出ExoViP系统,它是一个用于组合视觉推理的验证和探索工具。ExoViP的核心思想是提高复杂视觉任务中人工智能的推理能力,特别是当这些任务需要将复杂的查询转化为一系列可执行的视觉任务时。ExoViP在多个视觉推理任务上的应用,包括视觉问答、图像编辑和视频推理... 阅读全文

    优惠 大规模文本到视频生成数据集VIDGEN-1M:为了提升文本到视频模型的训练效果而特别设计的,它通过精细的筛选和标注过程,提供了高质量的视频和详细的文本描述

  • 大规模文本到视频生成数据集VIDGEN-1M:为了提升文本到视频模型的训练效果而特别设计的,它通过精细的筛选和标注过程,提供了高质量的视频和详细的文本描述
    AI
  • 复旦大学和上海人工智能科学研究院的研究人员推出大规模文本到视频生成数据集VIDGEN-1M,这个数据集是为了提升文本到视频模型的训练效果而特别设计的,它通过精细的筛选和标注过程,提供了高质量的视频和详细的文本描述。例如,你想要制作一个关于海滩日落的视频,你可以给模型一个文本描述,比如“一个男人戴着红帽子,穿着灰色衬衫站... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?