推荐类别

栏目分类

优惠 VD3D:让大型视频扩散变换器更好地控制3D摄像机的运动,从而在文本到视频生成的过程中实现更精细的控制

  • VD3D:让大型视频扩散变换器更好地控制3D摄像机的运动,从而在文本到视频生成的过程中实现更精细的控制
    AI
  • 多伦多大学、 Vector Institute 、Snap和SFU的研究人员推出新方法VD3D(Video Diffusion 3D),它可以让大型视频扩散变换器(Video Diffusion Transformers)更好地控制3D摄像机的运动,从而在文本到视频生成的过程 ...... 阅读全文

    百科 不喜欢新版本?如何在Windows系统上安装Microsoft Store软件的旧版本

  • 不喜欢新版本?如何在Windows系统上安装Microsoft Store软件的旧版本
  • 大家在 Windows 系统上安装软件时,是否会先在 Microsoft Store 搜索?我会这样做,商店里没有才会去官网进行下载。不过通过Microsoft Store安装和管理软件也会有问题。那就是Microsoft Store的自动更新功能虽然很便 ...... 阅读全文

    优惠 LLMs新训练方法Patch-Level Training:用于提高大语言模型的训练效率

  • LLMs新训练方法Patch-Level Training:用于提高大语言模型的训练效率
    AI
  • 微信 AI 模式识别中心的研究人员推出一种新的训练方法,名为“Patch-Level Training”,用于提高大语言模型(LLMs)的训练效率。这种方法通过将多个词元(tokens)压缩成一个“补丁”(patch),从而减少序列长度,降低 ...... 阅读全文

    优惠 Case2Code:训练和评估大语言模型进行归纳推理

  • Case2Code:训练和评估大语言模型进行归纳推理
    AI
  • 复旦大学计算机学院、上海人工智能实验室和香港中文大学的研究人员推出Case2Code,旨在训练和评估大语言模型(LLMs)进行归纳推理。归纳推理是一种认知过程,通过观察例子或序列变化来推断潜在规则。在编程领域,这 ...... 阅读全文

    优惠 新框架E5-V:利用多模态大语言模型来实现通用的多模态嵌入

  • 新框架E5-V:利用多模态大语言模型来实现通用的多模态嵌入
    AI
  • 北京航空航天大学和微软的研究人员推出新框架E5-V,,它利用多模态大语言模型(MLLMs)来实现通用的多模态嵌入(embeddings)。简单来说,E5-V可以帮助计算机更好地理解和处理图片和文字信息。比如,你给计算机一张 ...... 阅读全文

    优惠 评估框架LMMs-Eval:全面、低成本、无污染地评估大型多模态模型而设计

  • 评估框架LMMs-Eval:全面、低成本、无污染地评估大型多模态模型而设计
    AI
  • LMMs-Lab 团队 和南洋理工大学的研究人员推出评估框架LMMs-Eval,它是为了全面、低成本、无污染地评估大型多模态模型(LMMs)而设计的。想象一下,你有一个非常聪明的机器人助手,它可以看图片、读文字,甚至理解复 ...... 阅读全文

    优惠 大语言模型套件Spectra:经过了量化处理,以解决在大型语言模型推理过程中遇到的内存瓶颈问题

  • 大语言模型套件Spectra:经过了量化处理,以解决在大型语言模型推理过程中遇到的内存瓶颈问题
    AI
  • Nolano AI、蒙特利尔大学、印度理工学院 Kharagpur 分校、魁北克 AI 研究所和加州大学河滨分校的研究人员推出大语言模型(LLM)套件Spectra,这些模型经过了量化处理,以解决在大型语言模型推理过程中遇到的内存瓶颈 ...... 阅读全文

    优惠 免费开源的安卓手机投屏+控制软件Escrcpy ,在电脑上控制安卓手机

  • 免费开源的安卓手机投屏+控制软件Escrcpy ,在电脑上控制安卓手机
    工具
  • Escrcpy 是一个开源项目,它允许用户通过图形界面显示和控制 Android 设备。该项目由 Electron 驱动,无需账户,无广告,完全免费开源。它支持多种操作系统,包括 Windows、macOS 和 Linux,提供了一种无线的方式将 ...... 阅读全文

    优惠 3D光照新技术RRM:在不同的光照条件下重新渲染3D场景

  • 3D光照新技术RRM:在不同的光照条件下重新渲染3D场景
    AI
  • 巴黎综合理工学院和Adob​​e 研究中心的研究人员推出新技术RRM,可以让我们在不同的光照条件下重新渲染3D场景。这在计算机图形学和虚拟现实中非常有用,因为它允许我们更真实地模拟和观察场景在不同光照条件下的外观 ...... 阅读全文

    优惠 检索增强型图像描述生成模型的鲁棒性Robust-cap:通过查找相关信息来帮助生成图像描述的人工智能模型

  • 检索增强型图像描述生成模型的鲁棒性Robust-cap:通过查找相关信息来帮助生成图像描述的人工智能模型
    AI
  • 哥本哈根大学计算机科学系、里斯本大学高等技术学院 和Comcast 应用人工智能的研究人员发布论文,论文讨论的是“检索增强型图像描述生成模型的鲁棒性”。简单来说,就是研究一种可以通过查找相关信息来帮助生成图像描 ...... 阅读全文

    优惠 Speech Slytherin:新型序列模型Mamba应用于语音处理的三个关键任务:语音分离、自动语音识别(ASR)和文本到语音合成(TTS)

  • Speech Slytherin:新型序列模型Mamba应用于语音处理的三个关键任务:语音分离、自动语音识别(ASR)和文本到语音合成(TTS)
    AI
  • 哥伦比亚大学电气工程系的研究人员推出Speech Slytherin,探讨了一种新型的序列模型Mamba,并将其应用于语音处理的三个关键任务:语音分离、自动语音识别(ASR)和文本到语音合成(TTS)。Mamba是一种新型的序列模型 ...... 阅读全文

    优惠 StyleSplat:将艺术风格应用到3D场景中的方法,使得3D模型能够呈现出不同的艺术效果

  • StyleSplat:将艺术风格应用到3D场景中的方法,使得3D模型能够呈现出不同的艺术效果
    AI
  • 卡内基·梅隆大学的研究人员推出StyleSplat,这是一种将艺术风格应用到3D场景中的方法,使得3D模型能够呈现出不同的艺术效果。它能够将你选择的艺术风格应用到3D场景中的特定对象上,而不影响场景中的其他部分。例如 ...... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?