人工智能

优惠 大型3D重建模型LRM-Zero:完全使用合成的3D数据进行训练,以实现高质量的稀疏视图3D重建

  • 大型3D重建模型LRM-Zero:完全使用合成的3D数据进行训练,以实现高质量的稀疏视图3D重建
    AI
  • Adob​​e 研究 、石溪大学和基尔大学的研究人员推出大型3D重建模型LRM-Zero,它完全使用合成的3D数据进行训练,以实现高质量的稀疏视图3D重建。LRM-Zero的核心是名为Zeroverse的过程化3D数据集,这个数据集通过简单的基本形状、随机纹理和增强(例如高度场、布尔差分和线框)自动合成。LRM-Zer... 阅读全文

    优惠 新型基准测试工具MUIRBENCH:用来评估多模态大语言模型在理解多图像方面的能力

  • 新型基准测试工具MUIRBENCH:用来评估多模态大语言模型在理解多图像方面的能力
    AI
  • 南加州大学、宾大、明尼苏达大学、加州大学戴维斯分校、威斯康星大学麦迪逊分校、加州大学洛杉矶分校、俄亥俄州立大学、字节跳动和微软研究院的研究人员推出新型基准测试工具MUIRBENCH,它专门用来评估多模态大型语言模型(LLMs)在理解多图像方面的能力。简单来说,MUIRBENCH测试的是,当AI面对多个图片时,它是否能够... 阅读全文

    优惠 大型多语言多模态文档级语料库mOSCAR

  • 大型多语言多模态文档级语料库mOSCAR
    AI
  • 来自Inria 、法国国立科学研究院、巴黎政治大学、巴黎圣日耳曼大学信息科学系、法国国立科学研究院、巴黎政治大学信息科学发展与资源研究所、法国巴黎索邦大学、 通用爬行基金会和巴黎萨克雷大学的研究人员推出大型多语言多模态文档级语料库mOSCAR,mOSCAR是为了支持和改进多模态大型语言模型(mLLMs)的研究而创建的,... 阅读全文

    优惠 新型多语言视觉问答基准测试CVQA:通过包含多种文化和语言,推动多模态AI系统的发展,特别是提高它们在理解和推理视觉及文本数据方面的能力

  • 新型多语言视觉问答基准测试CVQA:通过包含多种文化和语言,推动多模态AI系统的发展,特别是提高它们在理解和推理视觉及文本数据方面的能力
    AI
  • MBZUAI推出新型多语言视觉问答(VQA)基准测试CVQA(Culturally-diverse Multilingual Visual Question Answering Benchmark),CVQA旨在通过包含多种文化和语言,推动多模态人工智能(AI)系统的发展,特别是提高它们在理解和推理视觉及文本数据方面的... 阅读全文

    优惠 估算生成式Ai在上下文学习中的“幻觉率”(hallucination rate)

  • 估算生成式Ai在上下文学习中的“幻觉率”(hallucination rate)
    AI
  • 这篇论文的主题是关于估算生成性人工智能(Generative AI)在上下文学习(In-Context Learning, ICL)中的“幻觉率”(hallucination rate)。在上下文学习中,一个条件生成模型(Conditional Generative Model, CGM)会被提供一组数据集,并基于这个... 阅读全文

    优惠 MLKV:针对Transformer模型解码过程中内存使用效率的一种改进

  • MLKV:针对Transformer模型解码过程中内存使用效率的一种改进
    AI
  • 万隆理工学院 (ITB)和MBZUAI推出一种名为MLKV(Multi-Layer Key-Value Heads)的新技术,它是针对Transformer模型解码过程中内存使用效率的一种改进。Transformer模型在自然语言处理(NLP)领域非常流行,但它们在进行自回归推理时,会因为需要存储和加载大量的键值(Ke... 阅读全文

    优惠 苹果推出新型视觉模型4M-21:能够在多种不同的输入和输出模态之间进行转换和预测

  • 苹果推出新型视觉模型4M-21:能够在多种不同的输入和输出模态之间进行转换和预测
    AI
  • 瑞士洛桑联邦理工学院 (EPFL)和苹果推出新型视觉模型4M-21,它是一个多模态、多任务的基础模型,能够在多种不同的输入和输出模态之间进行转换和预测。简单来说,4M-21就像一个多才多艺的艺术家,不仅能够理解一幅画(图像数据),还能根据这幅画创作出一首诗(文本描述)、一段音乐(深度信息)、甚至是一个舞蹈动作(3D人体... 阅读全文

    优惠 谷歌推出新颖的评估框架ToT:评估和提升大语言模型在时间推理(Temporal Reasoning)方面的能力

  • 谷歌推出新颖的评估框架ToT:评估和提升大语言模型在时间推理(Temporal Reasoning)方面的能力
    AI
  • 谷歌发布论文,论文的主题是关于评估和提升大语言模型(LLMs)在时间推理(Temporal Reasoning)方面的能力。时间推理对于智能系统来说是一项非常重要的任务,它涉及到理解不同事件之间的时间关系。然而,现有的时间推理基准测试通常只关注基于知识图谱(Knowledge Graph)的时间事实,这限制了研究的范围... 阅读全文

    优惠 微软推出新型混合神经网络架构SAMBA:高效处理无限上下文长度的语言建模而设计

  • 微软推出新型混合神经网络架构SAMBA:高效处理无限上下文长度的语言建模而设计
    AI
  • 微软和伊利诺伊大学香槟分校推出新型混合神经网络架构SAMBA,它专为高效处理无限上下文长度的语言建模而设计。SAMBA结合了状态空间模型(State Space Model,简称SSM)和滑动窗口注意力机制(Sliding Window Attention,简称SWA),旨在解决传统语言模型在处理极长文本时面临的性能和... 阅读全文

    优惠 Google DeepMind推出结合了Transformer和神经算法推理器的混合模型TransNAR

  • Google DeepMind推出结合了Transformer和神经算法推理器的混合模型TransNAR
    AI
  • Google DeepMind推出一种结合了Transformer和神经算法推理器(Neural Algorithmic Reasoners,简称NARs)的混合模型,称为TransNAR。这种模型旨在提升机器学习在处理自然语言理解(NLU)任务时的算法推理能力。通过在CLRS-Text基准测试上的实验表明,Trans... 阅读全文

    优惠 美图影像节发布AI短片创作工具MOKI,支持多种视频场景创作

  • 美图影像节发布AI短片创作工具MOKI,支持多种视频场景创作
    AI
  • 美图公司举办了第三届美图影像节,主题为“聊聊AI工作流”,现场发布了多款AI影像工具。美图创始人吴欣鸿曾指出Sora给行业带来心理冲击,美图致力于AI原生应用的创新。MOKI作为AI短片创作工具,可实现内容和成本的双重可控,支持多种视频场景创作。 MOKI功能特点 脚本、视觉风格、角色设定后,AI自动生成分镜图并转换为... 阅读全文

    优惠 Mozilla推出AI建站工具Solo AI 1.0,让网站开发更简单

  • Mozilla推出AI建站工具Solo AI 1.0,让网站开发更简单
    AI
  • Mozilla于2023年12月推出了面向无编程经验用户的Solo项目,通过AI技术辅助,即使是初学者也能创建出专业水准的网站。经过近半年的精心打磨,Solo AI 1.0版本正式发布。新版本引入了更丰富的动画效果,让网站设计更加生动精致。Mozilla公司表示,他们的目标是让用户轻松创建和发布网站。现在,他们将致力于... 阅读全文