推荐类别

栏目分类

优惠 3D编辑技术DreamCatalyst:基于SDS(分数蒸馏采样)的编辑解释为扩散模型的逆过程

  • 3D编辑技术DreamCatalyst:基于SDS(分数蒸馏采样)的编辑解释为扩散模型的逆过程
    AI
  • 韩国科学技术研究院人工智能研究生院推出3D编辑技术DreamCatalyst,它将基于SDS(分数蒸馏采样)的编辑解释为扩散模型的逆过程。我们的目标函数考虑了采样动力学,从而使DreamCatalyst的优化过程成为了编辑任务中扩散逆过程的一种近似。DreamCatalyst旨在缩短训练时间并提高编辑质量。DreamC... 阅读全文

    优惠 WeLore(权重低秩投影):以一种与数据无关且一次性的方式,统一了权重压缩和内存高效微调

  • WeLore(权重低秩投影):以一种与数据无关且一次性的方式,统一了权重压缩和内存高效微调
    AI
  • 德克萨斯大学奥斯汀分校、萨里大学、牛津大学、加州理工学院和Meta AI的研究人员推出“权重低秩投影”(Weight Low-Rank Projection,简称WeLore),它以一种与数据无关且一次性的方式,统一了权重压缩和内存高效微调。WeLore利用奇异值的重尾分布来识别适合LLMs中矩阵的秩减比例。除了作为压... 阅读全文

    优惠 Animate3D:通过一种特殊的方法,让静态的3D模型变得生动活泼,就像赋予了它们生命一样

  • Animate3D:通过一种特殊的方法,让静态的3D模型变得生动活泼,就像赋予了它们生命一样
    AI
  • 中国科学院自动化研究所和阿里巴巴集团达摩院的研究人员推出一种让3D模型动起来的技术Animate3D,它可以通过一种特殊的方法,让静态的3D模型变得生动活泼,就像赋予了它们生命一样。例如,你是一名游戏开发者,需要在游戏中创建一个会动的卡通角色。你可以先用3D建模软件设计这个角色的静态模型,然后使用Animate3D让这... 阅读全文

    优惠 基于大语言模型的智能代理框架Sibyl

  • 基于大语言模型的智能代理框架Sibyl
    AI
  • 百川公司 和天津大学智能与计算学院的研究人员推出智能助手Sibyl,Sibyl是一个基于大语言模型(LLM)的智能代理框架,旨在通过有效利用一组最小化的工具来解决复杂的现实世界问题。例如,你是一名研究人员,需要解决一个涉及多个学科的复杂问题。你可以向Sibyl提出问题,Sibyl会通过其工具规划器选择合适的工具(比如网... 阅读全文

    优惠 昆仑推出新型图像生成模型DiT-MoE

  • 昆仑推出新型图像生成模型DiT-MoE
    AI
  • 昆仑推出新型图像生成模型DiT-MoE,这个模型的全称是“Diffusion Transformers with Mixture of Experts”。简单来说,它是一种能够生成高质量图像的人工智能系统。它通过模拟一个逐步去噪和降噪的过程,将随机噪声转化为目标数据分布,从而生成图像。例如,你有一个超级聪明的机器人,它... 阅读全文

    优惠 NeedleBench框架:用来测试大语言模型处理长文本的能力

  • NeedleBench框架:用来测试大语言模型处理长文本的能力
    AI
  • 上海人工智能实验室和清华大学的研究人员推测NeedleBench框架,它专门用来测试大语言模型处理长文本的能力。这个框架通过设计一系列越来越具挑战性的任务,评估模型在处理多语言长文本时的检索和推理能力。这些任务涵盖了不同的文本长度和深度范围,允许在不同文本深度区域中策略性地插入关键数据点,以严格测试模型在多样化的上下文... 阅读全文

    优惠 阿里巴巴推出新型工具套件“Data-Juicer Sandbox”:促进多模态数据和生成模型的协同开发

  • 阿里巴巴推出新型工具套件“Data-Juicer Sandbox”:促进多模态数据和生成模型的协同开发
    AI
  • 阿里巴巴推出新型工具套件“Data-Juicer Sandbox”,它旨在促进多模态数据和生成模型的协同开发。多模态数据指的是包含文本、图像、视频和音频等多种类型的数据。生成模型则是指能够基于输入数据生成新内容的人工智能模型,例如根据文本描述生成图像或视频。 例如,你是一位厨师,需要准备一道复杂的菜肴,你需要各种食材(... 阅读全文

    优惠 阿里巴巴集团Qwen团队推出大型音频-语言模型Qwen2-Audio

  • 阿里巴巴集团Qwen团队推出大型音频-语言模型Qwen2-Audio
    AI
  • 阿里巴巴集团Qwen团队最新研发的大型音频-语言模型Qwen2-Audio。这个模型能够处理各种音频信号输入,并根据语音指令进行音频分析或直接文本回应。简单来说,Qwen2-Audio就像一个超级听力助手,不仅能听懂你说的话,还能根据你的声音指令做出反应。例如,你有一个智能助手,它不仅能听懂你说的话,还能分析你播放的音... 阅读全文

    百科 索尼PS2模拟器PCSX2迎来2.0版本更新:全新核心全新界面,让你玩游戏更加顺畅!

  • 索尼PS2模拟器PCSX2迎来2.0版本更新:全新核心全新界面,让你玩游戏更加顺畅!
  • 索尼 PS2 游戏机的开源模拟器项目 PCSX2,自上一次稳定版本发布以来,已经经历了超过6000次的变更,下载量超过了1亿次,并庆祝了其20周年纪念日。终于在近期发布了 2.0 版本。在过去的四年里,PCSX2团队致力于改进模拟器的性能、稳定性和兼容性,引入了一系列新功能和修复。 此次主要新特性包括:移除了 wxWi... 阅读全文

    情报 开源文本转语音(TTS)模型Fish Speech:高质量、易用且功能强大的语音合成解决方案

  • 开源文本转语音(TTS)模型Fish Speech:高质量、易用且功能强大的语音合成解决方案
  • Fish Speech 是由 Fish Audio 开发的一款开源文本转语音(TTS)模型,旨在提供高质量、易用且功能强大的语音合成解决方案。该项目在 GitHub 上开源,并迅速获得了较高的关注度,拥有数千颗星的评价。Fish Speech 经过十五万小时的训练数据,能够熟练处理中文、日语和英语等多种语言,其语言处理... 阅读全文

    优惠 Learning to Refuse: 保护大语言模型中的个人隐私数据

  • Learning to Refuse: 保护大语言模型中的个人隐私数据
    AI
  • 苏州大学计算机科学与技术学院人工智能研究所的研究人员发布论文,论文的主题是关于如何保护大语言模型(LLMs)中的个人隐私数据。随着AI技术的发展,大型语言模型在理解和生成自然语言方面表现出了惊人的能力,但同时也带来了隐私泄露的风险。这些模型可能会无意中记住训练数据中的个人信息,比如个人的名字、电子邮件地址、电话号码等敏... 阅读全文

    情报 阿里巴巴旗下Qwen团队发布Qwen2系列模型技术报告

  • 阿里巴巴旗下Qwen团队发布Qwen2系列模型技术报告
  • 阿里巴巴旗下Qwen团队在6月初就推出了Qwen2系列模型,而在近期才公开了Qwen2系列模型的技术报告,Qwen2系列模型是大型多模态模型,参数量从5亿到720亿不等,包括密集型模型和专家混合模型(Mixture-of-Experts,简称MoE)。例如,你有一个超级聪明的助手,它可以阅读和理解各种语言的书籍、文章,... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?