大语言模型

优惠 压缩能力和智能之间的关系:一个语言模型能够以更少的比特无损地压缩文本,这是否意味着它具有更高的智能?

  • 压缩能力和智能之间的关系:一个语言模型能够以更少的比特无损地压缩文本,这是否意味着它具有更高的智能?
    AI
  • 香港科技大学和腾讯的研究人员发布论文探讨了压缩能力和智能之间的关系。作者提出了一个问题:如果一个语言模型能够以更少的比特无损地压缩文本,这是否意味着它具有更高的智能?为了回答这个问题,论文对大语言模型 ...... 阅读全文

    优惠 如何提高多模态大语言模型(MLLMs)推理(inference)效率

  • 如何提高多模态大语言模型(MLLMs)推理(inference)效率
    AI
  • 高通发布论文探讨了如何提高多模态大语言模型(MLLMs)推理(inference)效率的问题。MLLMs是一类能够处理包括文本和图像在内的多种模态数据的模型,它们在现实世界中非常有用,因为我们的数据通常包含多种形式,如 ...... 阅读全文

    优惠 华为推出多模态大语言模型TextHawk:专门设计用于处理文档导向的任务,同时保持了处理多种模态任务的通用能力

  • 华为推出多模态大语言模型TextHawk:专门设计用于处理文档导向的任务,同时保持了处理多种模态任务的通用能力
    AI
  • 华为推出多模态大语言模型TextHawk,它专门设计用于处理文档导向的任务,同时保持了处理多种模态任务的通用能力。TextHawk在处理文档图像时表现出色,这些图像通常包含高分辨率和高信息密度,这对于传统的语言模型来 ...... 阅读全文

    优惠 斯坦福大学发布《2024人工智能指数报告》:揭示AI领域最新趋势与挑战

  • 斯坦福大学发布《2024人工智能指数报告》:揭示AI领域最新趋势与挑战
    AI
  • 斯坦福大学人类中心人工智能研究所发布《2024人工智能指数报告》,这已经是该研究所第七年发布《人工智能指数报告》,2024年版指数报告是该研究所迄今为止最为全面的报告,它诞生于人工智能对社会影响日益凸显的重要 ...... 阅读全文

    优惠 CodeTF:基于Python的Transformer一站式库,专为代码大语言模型(Code LLMs)和代码智能任务而设计

  • CodeTF:基于Python的Transformer一站式库,专为代码大语言模型(Code LLMs)和代码智能任务而设计
    AI
  • CodeTF是一个基于Python的Transformer一站式库,专为代码大语言模型(Code LLMs)和代码智能任务而设计。它提供了无缝的训练和推理接口,可应用于代码摘要生成、翻译、代码生成等任务。该库旨在促进SOTA CodeLLMs轻 ...... 阅读全文

    优惠 使用简单、纯粹的C/CUDA进行大语言模型训练的开源项目llm.c

  • 使用简单、纯粹的C/CUDA进行大语言模型训练的开源项目llm.c
    AI
  • llm.c是一个使用简单、纯粹的C/CUDA进行大语言模型训练的开源项目,无需庞大的245MB PyTorch或107MB cPython依赖。例如,GPT-2(CPU,fp32)的训练仅需要单个文件中约1000行的简洁代码。该代码能够立即编译并运行, ...... 阅读全文

    优惠 开源AI搜索引擎Morphic,快速获取问题答案无需手动查找

  • 开源AI搜索引擎Morphic,快速获取问题答案无需手动查找
    AI
  • Morphic是一个开源的AI搜索引擎,你可以借助于Vercel AI SDK快速部署,设置 OpenAI APIh后就可以使用。 ...... 阅读全文

    优惠 AI挑战《荒野大镖客2》:揭秘CRADLE智能体如何突破通用计算机控制难关

  • AI挑战《荒野大镖客2》:揭秘CRADLE智能体如何突破通用计算机控制难关
    AI
  • 北京人工智能研究院、南洋理工大学、北京大学计算机学院的研究人员发布论文,详细介绍了训练AI玩《荒野大镖客2:救赎》所面临的挑战,并对其在游戏中的表现进行了评估和评述。在题为《迈向通用计算机控制:以《荒野 ...... 阅读全文

    优惠 Inheritune:用于从现有的大型基础语言模型中开发小型基础语言模型

  • Inheritune:用于从现有的大型基础语言模型中开发小型基础语言模型
    AI
  • 德克萨斯大学奥斯汀分校的研究人员推出简单方法Inheritune,用于从现有的大型基础语言模型(LM)中开发小型基础语言模型。这种方法的核心思想是:首先从大型LM中继承几个变压器块(层),然后在非常小的数据集(例如 ...... 阅读全文

    优惠 单目深度估计任务:自然语言指导在低层次视觉任务中的鲁棒性

  • 单目深度估计任务:自然语言指导在低层次视觉任务中的鲁棒性
    AI
  • 亚利桑那州立大学和马里兰大学巴尔的摩县分校的研究团队发布论文论文探讨了自然语言指导在低层次视觉任务中的鲁棒性,特别是单目深度估计任务。单目深度估计是指使用单个图像来预测场景中每个像素的深度信息。最近的 ...... 阅读全文

    优惠 强化学习算法DR-PO:数据集重置策略优化,主要用于从人类偏好反馈中微调生成模型

  • 强化学习算法DR-PO:数据集重置策略优化,主要用于从人类偏好反馈中微调生成模型
    AI
  • 来自康奈尔大学、普林斯顿大学和微软的研究人员推出新的强化学习算法数据集重置策略优化(Dataset Reset Policy Optimization,简称DR-PO),主要用于从人类偏好反馈中微调生成模型,例如GPT-4和Claude3 Opus等。这 ...... 阅读全文

    优惠 完全免费、私密且本地运行的搜索聚合器和答案生成器FreeAskInternet

  • 完全免费、私密且本地运行的搜索聚合器和答案生成器FreeAskInternet
    AI
  • FreeAskInternet 是一款完全免费、私密且本地运行的搜索聚合器和答案生成器,它利用大型语言模型(LLM)工作,无需 GPU 支持。用户可以通过 FreeAskInternet 界面提出问题,系统会调用本地运行的 searxng 进行多引擎 ...... 阅读全文