推荐类别

栏目分类

优惠 pin.gl:无需注册的即时屏幕分享工具

  • pin.gl:无需注册的即时屏幕分享工具
    工具
  • pin.gl 是一款简洁的PWA应用,它允许用户通过浏览器在不安装任何额外软件的情况下,实现屏幕画面或镜头的即时分享。这项服务无需注册账号,用户只需开启应用并设置一个Room code,即可生成分享者和观众两种链接,确 ...... 阅读全文

    优惠 新型模型架构LLaMA-Omni:实现与大语言模型(LLMs)的低延迟、高质量的语音交互

  • 新型模型架构LLaMA-Omni:实现与大语言模型(LLMs)的低延迟、高质量的语音交互
    AI
  • 中国科学院计算技术研究所智能信息处理重点实验室、中国科学院人工智能安全重点实验室和中国科学院大学的研究人员推出新型模型架构LLaMA-Omni,它旨在实现与大语言模型(LLMs)的低延迟、高质量的语音交互。例如,你 ...... 阅读全文

    优惠 视频生成音频系统Draw an Audio:根据视频内容自动生成与之匹配的声音效果

  • 视频生成音频系统Draw an Audio:根据视频内容自动生成与之匹配的声音效果
    AI
  • 中国科学院自动化研究所和美团点评的研究人员推出视频生成音频系统Draw an Audio,这个系统能够根据视频内容自动生成与之匹配的声音效果,这在电影制作中被称为“Foley”艺术。例如,你给这个系统一段没有声音的视频, ...... 阅读全文

    优惠 歌曲生成系统SongCreator:能创作出一首包含旋律、伴奏和歌声的完整歌曲

  • 歌曲生成系统SongCreator:能创作出一首包含旋律、伴奏和歌声的完整歌曲
    AI
  • 清华大学深圳国际研究生院、香港中文大学的研究人员推出SongCreator,它是一个基于歌词生成完整歌曲的人工智能系统。想象一下,你给SongCreator提供一段歌词,它就能创作出一首包含旋律、伴奏和歌声的完整歌曲,就像 ...... 阅读全文

    优惠 基准测试“MOCHI”:评估人类观察者和计算机视觉模型在三维形状推断任务上的一致性

  • 基准测试“MOCHI”:评估人类观察者和计算机视觉模型在三维形状推断任务上的一致性
    AI
  • 加州大学伯克利分校和麻省理工学院的研究人员推出基准测试“MOCHI”,旨在评估人类观察者和计算机视觉模型在三维形状推断任务上的一致性。这个任务要求参与者从三个不同视角的图像中识别出哪个图像显示的对象是不同的 ...... 阅读全文

    优惠 三维物体检测模型UniDet3D:能够从点云数据中识别和定位室内环境中的物体

  • 三维物体检测模型UniDet3D:能够从点云数据中识别和定位室内环境中的物体
    AI
  • 人工智能研究院推出三维物体检测模型UniDet3D,它能够从点云数据中识别和定位室内环境中的物体。这个模型特别适用于机器人和增强现实(AR)领域,因为它可以提供对三维空间中物体的精确理解。总的来说,UniDet3D通过 ...... 阅读全文

    优惠 机器人框架Robot Utility Models(RUMs):训练能够在新环境中零样本部署的机器人策略

  • 机器人框架Robot Utility Models(RUMs):训练能够在新环境中零样本部署的机器人策略
    AI
  • 纽约大学、Hello Robot、Meta的研究人员推出新的机器人框架Robot Utility Models(RUMs),它旨在训练能够在新环境中零样本部署的机器人策略。这些策略能够在没有进一步微调的情况下,直接泛化到新的环境和对象上。 ...... 阅读全文

    优惠 新型视觉-语言模型POINTS:通过一些高效且经济的策略来提升模型的性能

  • 新型视觉-语言模型POINTS:通过一些高效且经济的策略来提升模型的性能
    AI
  • 腾讯公司微信 AI 模式识别中心、上海交通大学和南京大学的研究人员推出新型视觉-语言模型POINTS,旨在通过一些高效且经济的策略来提升模型的性能。这个模型专注于处理图像和文本信息,使其在理解和生成与视觉内容相 ...... 阅读全文

    优惠 基准测试CKnowEdit:通过知识编辑技术纠正和改进大语言模型中的中文知识

  • 基准测试CKnowEdit:通过知识编辑技术纠正和改进大语言模型中的中文知识
    AI
  • 浙江大学和加州大学圣地亚哥分校的研究人员推出基准测试CKnowEdit,旨在通过知识编辑技术纠正和改进大语言模型(LLMs)中的中文知识。这项工作特别关注中文语言和文化领域,因为这些领域在现有的LLMs中常常被误解或 ...... 阅读全文

    优惠 Paper Copilot:为研究人员设计的个性化学术助手,基于大语言模型

  • Paper Copilot:为研究人员设计的个性化学术助手,基于大语言模型
    AI
  • 伊利诺伊大学香槟分校、卡内基梅隆大学、卡尔顿学院的研究人员推出一个名为“Paper Copilot”的系统,它是一个为研究人员设计的个性化学术助手,基于大语言模型(LLM)。这个系统的核心目标是帮助科研人员更有效地在海 ...... 阅读全文

    优惠 新型多模态大语言模型的指令数据演化框架MMEvol

  • 新型多模态大语言模型的指令数据演化框架MMEvol
    AI
  • SIAT、UCAS、阿里巴巴、同济大学和USYD的研究人员推出新型多模态大语言模型(MLLM)的指令数据演化框架MMEvol,这个框架的目的是提高MLLM在处理视觉和语言任务时的能力,通过自动生成更复杂和多样化的图像-文本指令 ...... 阅读全文

    情报 欧洲最高法院对谷歌和苹果分别作出了数十亿美元的罚款决定

  • 欧洲最高法院对谷歌和苹果分别作出了数十亿美元的罚款决定
  • 在一场历时近十年的反垄断斗争中,欧洲最高法院近日对谷歌和苹果分别作出了数十亿美元的罚款决定。这一裁决为欧盟反垄断负责人玛格丽特·维斯塔格(Margrethe Vestager)针对这两大科技巨头的长期调查画上了句号。 苹 ...... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?