推荐类别

栏目分类

优惠 ExAvatar:可以从一段简单的单眼视频创建出一个全身3D高表达性人类化身

  • ExAvatar:可以从一段简单的单眼视频创建出一个全身3D高表达性人类化身
    AI
  • DGIST 和Meta的研究人员推出ExAvatar,它可以从一段简单的单眼视频创建出一个全身3D高表达性人类化身(3D avatar)。ExAvatar不仅能够模拟人体的运动,还能模拟面部表情和手部动作,这些都是人们表达情感和与世界互动的重要方式。例如,你录制了一段自己跳舞的视频,使用ExAvatar技术,可以从这段... 阅读全文

    优惠 开放词汇的视听语义分割OV-AVSS:在视频中识别和分类发出声音的物体,即使这些物体的类别在训练数据中从未出现过

  • 开放词汇的视听语义分割OV-AVSS:在视频中识别和分类发出声音的物体,即使这些物体的类别在训练数据中从未出现过
    AI
  • 新型视听语义分割任务,称为开放词汇的视听语义分割(Open-Vocabulary Audio-Visual Semantic Segmentation,简称OV-AVSS)。这项技术的目标是在视频中识别和分类发出声音的物体,即使这些物体的类别在训练数据中从未出现过。例如,你在观看一个包含多种乐器演奏的音乐会视频,即使训... 阅读全文

    优惠 谷歌推出内容审核系统ShieldGemma:基于大语言模型构建的,专门用于检测和过滤不安全内容

  • 谷歌推出内容审核系统ShieldGemma:基于大语言模型构建的,专门用于检测和过滤不安全内容
    AI
  • 谷歌推出内容审核系统ShieldGemma,它是基于大语言模型(LLMs)构建的,专门用于检测和过滤不安全内容。这个系统就像是网络世界的保安,能够辨别出不当的言语或行为,保护用户免受有害信息的影响。例如,有一个在线论坛,用户可能会发布包含仇恨言论或不当内容的帖子。使用ShieldGemma,系统可以自动检测这些帖子,并... 阅读全文

    优惠 高质量、类人同声传译系统CLASI:在演讲者讲话的同时,系统能够即时地提供翻译,让听众能够理解演讲内容

  • 高质量、类人同声传译系统CLASI:在演讲者讲话的同时,系统能够即时地提供翻译,让听众能够理解演讲内容
    AI
  • 字节跳动研究院跨语言代理团队推出高质量、类人同声传译系统CLASI, CLASI的主要功能是同声传译,即在演讲者讲话的同时,系统能够即时地提供翻译,让听众能够理解演讲内容。例如,你正在观看一个英文的科技产品发布会,但你的母语是中文。演讲者介绍了一款新的智能手机,使用了大量专业术语,如"Ising model"(伊辛模型... 阅读全文

    优惠 Reenact Anything:实现一种语义视频运动转移的功能,可以让一张静态图片中的对象动起来,模仿另一个视频中的运动

  • Reenact Anything:实现一种语义视频运动转移的功能,可以让一张静态图片中的对象动起来,模仿另一个视频中的运动
    AI
  • 瑞士苏黎世联邦理工学院和迪士尼研究工作室的研究人员推出Reenact Anything,它能够实现一种语义视频运动转移的功能。简单来说,这项技术可以让一张静态图片中的对象动起来,模仿另一个视频中的运动。这不是简单的模仿动作,而是在保持原有图片外观和布局的同时,让图片中的对象按照视频里的动作进行“表演”。 例如,你有一张... 阅读全文

    优惠 通过对比性微调(contrastive fine-tuning)来提升小型语言模型的文本嵌入(text embeddings)质量

  • 通过对比性微调(contrastive fine-tuning)来提升小型语言模型的文本嵌入(text embeddings)质量
    AI
  • 清华大学计算机科学与技术系的研究人员发布论文,论文的主题是探讨如何通过对比性微调(contrastive fine-tuning)来提升小型语言模型的文本嵌入(text embeddings)质量。文本嵌入是一种将文本转换为向量表示的技术,这些向量能够捕捉文本的语义信息,使得机器能够更好地理解自然语言。 GitHub:... 阅读全文

    情报 英伟达AI芯片生产遇挑战,B200芯片推迟上市

  • 英伟达AI芯片生产遇挑战,B200芯片推迟上市
  • 尽管英伟达(NVIDIA)在人工智能(AI)芯片市场上占据领先地位,但近期面临着内外部挑战。除了受到监管机构的反垄断调查之外,其最新一代 AI 芯片「Blackwell」B200 的生产也出现了延误。据报道,英伟达已通知微软及其他至少一家云服务提供商,B200 AI 芯片的生产将至少推迟三个月。这一延误是因为在生产过程... 阅读全文

    优惠 Rotato Video File Compressor:高效视频压缩新选择,90%压缩率不失真

  • Rotato Video File Compressor:高效视频压缩新选择,90%压缩率不失真
    工具
  • Rotato 是一家专注于模型图像及定制化 3D 模型制作的公司,由前 Google 员工创办。其特色在于能在几分钟内快速创建 3D 模型动画。此外,Rotato 还提供了一系列免费工具,包括视频透明度测试器、视频转换器以及一款高效的视频压缩器。 Rotato 视频压缩器特点 在线压缩:无需下载或安装任何软件。 高效压... 阅读全文

    情报 GitHub推出AI模型服务GitHub Models,定位 AI 工程师,让开发者试用和部署模型

  • GitHub推出AI模型服务GitHub Models,定位 AI 工程师,让开发者试用和部署模型
  • 微软旗下的代码托管平台GitHub最近推出了一项名为GitHub Models的新服务,旨在成为新一代AI工程师,协助开发者选择和应用适合其项目的AI模型。 地址:https://github.com/marketplace/models 服务定位与目标用户 GitHub Models的定位是服务于平台上超过1亿的用户... 阅读全文

    情报 谷歌豪掷 25 亿美元收购 AI 独角兽 Character.AI,创始人率团队加入谷歌

  • 谷歌豪掷 25 亿美元收购 AI 独角兽 Character.AI,创始人率团队加入谷歌
  • 据彭博社最新报道,AI领域的独角兽企业Character.AI的创始人诺姆・沙泽尔(Noam Shazeer)和丹尼尔・德・弗雷塔斯(Daniel De Freitas)以及部分研究团队成员已于上周五正式加入谷歌公司。报道中提到,现有投资者计划以25亿美元(约合179.64亿元人民币)的价格收购Character.AI... 阅读全文

    情报 uBlock Origin 在 Chrome 127 版本中提示支持即将结束

  • uBlock Origin 在 Chrome 127 版本中提示支持即将结束
  • uBlock Origin 的首席开发者和维护者 Raymond Hill 在 GitHub 上发布公告,自谷歌 Chrome 浏览器 127 版本开始,uBlock Origin (uBO) 扩展程序将出现“该扩展即将结束支持”的提醒。 原因 谷歌在 Chrome 新版浏览器中弃用了 Manifest v2,转而支持... 阅读全文

    百科 如何在Windows 11上更改鼠标滚轮滚动方向

  • 如何在Windows 11上更改鼠标滚轮滚动方向
  • 在使用电脑时,鼠标的滚动方向对操作体验至关重要。在Windows 11操作系统中,您可以根据自己的习惯,选择两种不同的方法来调整鼠标滚轮的滚动方式。(来源) 用户习惯与新功能 大多数用户习惯于向下滚动鼠标滚轮来向上浏览页面,或者使用滚动条向下滚动。但有用户更喜欢反向设置滚动方向,即向下滚动时页面向下移动,向上滚动滚轮时... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?