大语言模型

优惠 可在手机上运行的微型语言模型MobiLlama

  • 可在手机上运行的微型语言模型MobiLlama
    AI
  • 来自穆罕默德·本·扎耶德人工智能大学、澳大利亚国立大学、阿尔托大学、墨尔本大学、林雪平大学的研究人员推出小型语言模型MobiLlama,它是为了满足资源受限设备上的高效、准确语言处理需求而设计的。在当今大语言模 ...... 阅读全文

    优惠 检索增强生成(RAG)的框架MIRAGE,旨在提高大语言模型在医学问答(QA)任务中的性能

  • 检索增强生成(RAG)的框架MIRAGE,旨在提高大语言模型在医学问答(QA)任务中的性能
    AI
  • 美国国立卫生研究院国家医学图书馆发布论文的主题是关于如何提高大语言模型(LLMs)在医学领域问题回答(QA)任务中的性能。LLMs在很多领域都表现出色,但在医学问题回答上,它们有时会生成听起来合理但实际上是错误 ...... 阅读全文

    优惠 Mistral AI推出最新模型Mistral Large,性能仅次于GPT 4

  • Mistral AI推出最新模型Mistral Large,性能仅次于GPT 4
    AI
  • Mistral AI在当地时间2月26日发布了其最新的Mistral Large模型,该模型在性能上仅次于GPT 4。Mistral Large是一款功能强大的多语言模型,适用于各种复杂的推理任务,包括文本理解、转换和代码生成。 卓越的推理能力 ...... 阅读全文

    优惠 搞迷信!免费生肖和星座AI聊天机器人Zodiac Chat AI

  • 搞迷信!免费生肖和星座AI聊天机器人Zodiac Chat AI
    AI
  • Zodiac Chat AI是一款免费的在线占星术工具,旨在彻底改变个人与其星座和占星术之间的互动方式。这款用户友好的平台利用先进的人工智能技术,只需一键点击,就能提供个性化的解读、深刻的预测和详尽的星座分析。无论 ...... 阅读全文

    优惠 小型语言模型Orca-Math:解决小学数学问题方面

  • 小型语言模型Orca-Math:解决小学数学问题方面
    AI
  • 微软的研究人员发布论文介绍了一个名为Orca-Math的小型语言模型(SLM),它在解决小学数学问题方面表现出色。尽管数学问题解决一直被认为是小型语言模型的一个复杂任务,但Orca-Math在GSM8K基准测试上达到了约87%的 ...... 阅读全文

    优惠 CLoVe:提高现有的视觉-语言模型(VLMs)在处理组合语言时的能力

  • CLoVe:提高现有的视觉-语言模型(VLMs)在处理组合语言时的能力
    AI
  • 密歇根大学安娜堡分校、Netflix的研究人员发布论文介绍了一个名为CLoVe(Contrastive Language-Image Vision Models)的框架,旨在提高现有的视觉-语言模型(VLMs)在处理组合语言时的能力。VLMs,如CLIP模型,通常 ...... 阅读全文

    优惠 大语言模型(LLMs)在处理不同长度输入时的表现,特别是它们在处理长文本时的推理能力

  • 大语言模型(LLMs)在处理不同长度输入时的表现,特别是它们在处理长文本时的推理能力
  • 巴伊兰大学、艾伦人工智能研究所的研究人员发布论文探讨了大语言模型(LLMs)在处理不同长度输入时的表现,特别是它们在处理长文本时的推理能力。尽管LLMs在许多任务上取得了显著进展,但它们在不同输入长度下的性能 ...... 阅读全文

    优惠 “放射性”(radioactivity)在大语言模型(LLMs)生成的文本中的表现

  • “放射性”(radioactivity)在大语言模型(LLMs)生成的文本中的表现
    AI
  • Meta、巴黎综合理工学院的研究人员发布论文探讨了一个有趣的概念,即“放射性”(radioactivity)在大语言模型(LLMs)生成的文本中的表现。这里的“放射性”指的是,当一个模型(我们称之为Alice的模型)的输出被用作另 ...... 阅读全文

    优惠 MobileLLM:如何在移动设备上高效使用大语言模型

  • MobileLLM:如何在移动设备上高效使用大语言模型
    AI
  • 这篇论文的主题是关于如何在移动设备上高效使用大语言模型(LLMs)。随着云计算成本的增加和对延迟的担忧,移动设备上的大型语言模型变得越来越重要。论文的重点是设计拥有不到十亿参数的高质量大型语言模型,这对于 ...... 阅读全文

    优惠 如何有效地从大语言模型(LLMs)中提取和压缩推理任务的关键部分

  • 如何有效地从大语言模型(LLMs)中提取和压缩推理任务的关键部分
    AI
  • 来自苹果和密歇根大学的研究人员发布论文探讨了如何有效地从大语言模型(LLMs)中提取和压缩推理任务的关键部分。作者提出了一种策略,将复杂推理任务分解为问题分解阶段和问题解决阶段,并展示了这种两阶段策略能够 ...... 阅读全文

    优惠 ChunkAttention:提高大语言模型(LLMs)在处理长序列时的自注意力(self-attention)模块的效率

  • ChunkAttention:提高大语言模型(LLMs)在处理长序列时的自注意力(self-attention)模块的效率
    AI
  • 微软发布论文介绍了一种名为ChunkAttention的新方法,它旨在提高大语言模型(LLMs)在处理长序列时的自注意力(self-attention)模块的效率。自注意力是LLMs的核心组成部分,但在推理长序列时会导致显著的延迟。Chun ...... 阅读全文

    优惠 大型数据集API-BLEND:训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型

  • 大型数据集API-BLEND:训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型
    AI
  • IBM推出大型数据集API-BLEND,它旨在训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型(LLMs)。这些模型通常用于执行复杂的任务,比如预订酒店、预订餐厅或自动化工作招聘任务。API-BLEND数据集 ...... 阅读全文