推荐类别

栏目分类

优惠

  • AI
  • 来自上海人工智能实验室、浙江大学和香港中文大学的研究人员推出新型的三维场景理解模型——Grounded 3D-LLM(Grounded 3D Large Language Model)。这个模型旨在通过结合三维视觉和语言模型,来处理和理解复杂的三维场景。下面我将用通俗易懂的语言来介绍这个模型的主要功能、特点、工作原理以... 阅读全文

    优惠 ChatFlow:低成本效益的方式训练大语言模型,特别是针对中文这样的非英语语言

  • ChatFlow:低成本效益的方式训练大语言模型,特别是针对中文这样的非英语语言
    AI
  • 来自深圳大学计算机科学与软件工程学院、腾讯AI实验室、 武汉大学和西交利物浦人工智能与先进计算学院的研究人员推出ChatFlow,这是一种成本效益的方式训练大型语言模型(LLMs),特别是针对中文这样的非英语语言。大型语言模型在自然语言处理(NLP)领域有着广泛的应用,但训练这些模型来处理除了英语之外的语言面临很多挑战... 阅读全文

    优惠 IBM推出INDUS:为科学应用而设计,能够处理地球科学、生物学、物理学、太阳物理学、行星科学和天体物理学等领域的专业任务

  • IBM推出INDUS:为科学应用而设计,能够处理地球科学、生物学、物理学、太阳物理学、行星科学和天体物理学等领域的专业任务
    AI
  • 由IBM Research AI和其他合作机构共同开发的一套大语言模型INDUS,这些模型专门为科学应用而设计,能够处理地球科学、生物学、物理学、太阳物理学、行星科学和天体物理学等领域的专业任务。 主题介绍: 想象一下,你有一个超级助手,它能够阅读和理解大量的科学文献,并且能够回答你关于这些领域的复杂问题。这就像是拥有... 阅读全文

    优惠 Two Platforms推出多语言大语言模型架构SUTRA,它能够理解、推理并用超过50种语言生成文本

  • Two Platforms推出多语言大语言模型架构SUTRA,它能够理解、推理并用超过50种语言生成文本
    AI
  • Two Platforms推出多语言大语言模型(LLM)架构SUTRA,它能够理解、推理并用超过50种语言生成文本。SUTRA的设计独特之处在于它将核心概念理解与语言特定处理分离开来,这有助于实现可扩展和高效的多语言对齐和学习。SUTRA采用了专家混合(Mixture of Experts,MoE)框架,既用于语言处理... 阅读全文

    优惠 腾讯推出全面基准测试Plot2Code:评估多模态大语言模型在将科学图表转换为可执行代码方面的能力而设计

  • 腾讯推出全面基准测试Plot2Code:评估多模态大语言模型在将科学图表转换为可执行代码方面的能力而设计
    AI
  • 腾讯推出全面基准测试Plot2Code,它是为了评估多模态大语言模型(MLLMs)在将科学图表转换为可执行代码方面的能力而设计的。MLLMs在视觉领域的应用取得了显著进展,但它们在将视觉图表转换为代码方面的能力尚未得到充分评估。Plot2Code旨在填补这一空白,提供一个公平且深入的评估框架。 通俗介绍: 想象一下,你... 阅读全文

    优惠 SambaNova推出新型AI加速器SambaNova SN40L:解决大型单一AI模型(如GPT-4)在训练、服务和维护时面临的成本高昂和挑战性问题

  • SambaNova推出新型AI加速器SambaNova SN40L:解决大型单一AI模型(如GPT-4)在训练、服务和维护时面临的成本高昂和挑战性问题
    AI
  • SambaNova推出新型AI加速器SambaNova SN40L,它通过采用数据流架构和专家组合(Composition of Experts,简称CoE)的方法,有效扩展了AI的内存容量。这种加速器旨在解决大型单一AI模型(如GPT-4)在训练、服务和维护时面临的成本高昂和挑战性问题。 通俗介绍: 想象一下,你有一... 阅读全文

    优惠 Adobe Research推出LogoMotion:基于大语言模型自动为静态布局生成动画

  • Adobe Research推出LogoMotion:基于大语言模型自动为静态布局生成动画
    AI
  • Adobe Research推出LogoMotion,它是一个基于大语言模型(LLM)的方法,能够自动为静态布局生成动画。这个过程是内容感知的,意味着动画的生成会考虑到布局中的视觉内容和结构。LogoMotion通过两个阶段来实现:视觉上下文的程序合成和程序修复。LogoMotion展示了如何将大型语言模型应用于复杂的... 阅读全文

    优惠 微软推出大型信息丰富的网络数据集MS MARCO Web Search

  • 微软推出大型信息丰富的网络数据集MS MARCO Web Search
    AI
  • 微软推出大型信息丰富的网络数据集MS MARCO Web Search,它包含了数百万真实点击的查询-文档标签。这个数据集是首次尝试,旨在模拟现实世界中的网页文档和查询分布,为各种类型的下游任务提供丰富的信息,并鼓励在多个研究领域进行创新,例如通用的端到端神经索引器模型、通用嵌入模型,以及使用大型语言模型的下一代信息访... 阅读全文

    优惠 Hugging Face推出具有8亿参数的视觉-语言模型Idefics2

  • Hugging Face推出具有8亿参数的视觉-语言模型Idefics2
    AI
  • 这篇论文的主题是关于构建视觉-语言模型(Vision-Language Models,简称VLMs)。这类模型结合了图像处理和自然语言处理的能力,能够理解图像内容并根据图像内容生成文字描述,或者根据文字描述找到相关的图像。论文中提到的Idefics2模型就是一个具有8亿参数的视觉-语言模型,它在多种多模态基准测试中表现... 阅读全文

    优惠 浙江大学和字节跳动的研究人员推出新颖框架Coin3D:用于生成可控且交互式的3D资产

  • 浙江大学和字节跳动的研究人员推出新颖框架Coin3D:用于生成可控且交互式的3D资产
    AI
  • 浙江大学和字节跳动的研究人员推出新颖框架Coin3D,它用于生成可控且交互式的3D资产。Coin3D的核心思想是使用由基本形状(如球体、立方体、圆柱体等)组成的粗糙代理(proxy)来引导3D对象的生成,从而实现对生成过程的精细控制。这就像我们用乐高积木搭建模型一样,可以通过组合简单的积木来创造出复杂的结构。 例如,一... 阅读全文

    优惠 亚马逊AWS推出新型大型多模态语言模型SpeechVerse:能够理解和执行自然语言指令,处理各种语音相关的任务

  • 亚马逊AWS推出新型大型多模态语言模型SpeechVerse:能够理解和执行自然语言指令,处理各种语音相关的任务
    AI
  • 亚马逊AWS推出新型大型多模态语言模型SpeechVerse,它能够理解和执行自然语言指令,处理各种语音相关的任务。SpeechVerse通过结合预训练的语音和文本基础模型,并在学习过程中保持这些模型的参数固定,实现了这一功能。它使用从语音基础模型中提取的连续潜在表示来进行指令微调,以在多种语音处理任务上实现最佳的零样... 阅读全文

    优惠 SpeechGuard:集成语音和大语言模型(SLMs)的安全性和鲁棒性

  • SpeechGuard:集成语音和大语言模型(SLMs)的安全性和鲁棒性
    AI
  • 亚马逊AWS发布论文探讨集成语音和大语言模型(SLMs)的安全性和鲁棒性。SLMs是一类能够遵循语音指令并生成相关文本回答的AI系统,它们在最近变得越来越流行。然而,这些模型的安全防护和抵御恶意攻击的能力还不是很清楚。 主要功能: SLMs能够处理语音输入,并据此生成文本回答。 它们被设计来遵循用户的语音指令。 主要特... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?