推荐类别

栏目分类

优惠 新型框架LLaVA-MoD:通过专家混合(MoE)知识蒸馏技术使大型多模态语言模型变得小型化

  • 新型框架LLaVA-MoD:通过专家混合(MoE)知识蒸馏技术使大型多模态语言模型变得小型化
    AI
  • 阿里巴巴、香港中文大学、香港感知与交互智能研究中心和北京航空航天大学的研究人员推出新型框架LLaVA-MoD,通过专家混合(MoE)知识蒸馏技术使大型多模态语言模型(MLLM)变得小型化。简单来说,LLaVA-MoD的目标是 ...... 阅读全文

    优惠 多模态大语言模型EAGLE:专门设计用于提升模型在处理视觉信息时的能力

  • 多模态大语言模型EAGLE:专门设计用于提升模型在处理视觉信息时的能力
    AI
  • 英伟达、佐治亚理工学院、UMD和香港理工大学的研究人员推出多模态大语言模型EAGLE,专门设计用于提升模型在处理视觉信息时的能力。简单来说,EAGLE项目的目标是让语言模型能够更好地“看懂”和理解图片,并将这些视觉 ...... 阅读全文

    优惠 Nexa AI推出新型语言模型架构Dolphin:为节能的长文本处理而设计

  • Nexa AI推出新型语言模型架构Dolphin:为节能的长文本处理而设计
    AI
  • Nexa AI推出新型语言模型架构Dolphin,它专为节能的长文本处理而设计,尤其适用于设备上的模型(on-device models)。想象一下,如果你的手机或智能手表需要处理大量的文本数据,比如翻译一篇长文章或者回答关于复杂 ...... 阅读全文

    优惠 BaichuanSEED:通过精细的预训练和微调策略,实现了与行业领先模型相当的性能

  • BaichuanSEED:通过精细的预训练和微调策略,实现了与行业领先模型相当的性能
    AI
  • 大语言模型(LLM)的通用能力高度依赖于广泛预训练数据集的组成和选择,这些数据集通常被视为多个机构的商业机密。为了解决这一问题,百川开源了一种适用于所有场景的数据处理流程的细节,并通过引入一个竞争力强的L ...... 阅读全文

    优惠 新游发售 《雨中冒险2》DLC《风暴探寻者》发布,玩家反响褒贬不一 50元

  • 《雨中冒险2》DLC《风暴探寻者》发布,玩家反响褒贬不一
    STEAM
  • 昨日,《雨中冒险2》(Risk of Rain 2)的最新DLC《风暴探寻者》正式推出,这款深受欢迎的Rougelike多人合作射击游戏在Steam上的活跃玩家数达到了历史新高,但玩家的反馈却显得有些复杂。根据SteamDB的数据,昨晚《 ...... 阅读全文

    优惠 阿里巴巴推出新型文本阅读模型Platypus:能够从各种形式的图像中读取文本,无论是自然场景还是文档

  • 阿里巴巴推出新型文本阅读模型Platypus:能够从各种形式的图像中读取文本,无论是自然场景还是文档
    AI
  • 阿里巴巴推出新型文本阅读模型Platypus,它能够从各种形式的图像中读取文本,无论是自然场景还是文档。这个模型的设计理念是结合专家模型(specialist models)的高精度和通用模型(generalist models)的广泛适用性 ...... 阅读全文

    优惠 交互式3D布局控制方法“Build-A-Scene(BAS)”

  • 交互式3D布局控制方法“Build-A-Scene(BAS)”
    AI
  • 沙特阿拉伯国王科技大学的研究人员推出交互式3D布局控制方法“Build-A-Scene”(简称BAS),用于基于扩散模型的图像生成。简单来说,这个方法允许用户通过提供一个3D布局来控制图像中物体的类型、位置和方向,然后系统 ...... 阅读全文

    优惠 新型AI游戏引擎GameNGen:完全由神经网络模型驱动,能够实现与复杂环境的实时交互,并且能够在长时间内保持高质量

  • 新型AI游戏引擎GameNGen:完全由神经网络模型驱动,能够实现与复杂环境的实时交互,并且能够在长时间内保持高质量
    AI
  • 特拉维夫大学和谷歌的研究人员推出新型游戏引擎GameNGen,它完全由神经网络模型驱动,能够实现与复杂环境的实时交互,并且能够在长时间内保持高质量。简单来说,GameNGen就像是一个智能的虚拟世界构建者,它可以在极 ...... 阅读全文

    优惠 MagicMan:用于生成人类新视角图像的模型,能够在3D空间中意识到人类的形态和动作

  • MagicMan:用于生成人类新视角图像的模型,能够在3D空间中意识到人类的形态和动作
    AI
  • 清华大学深圳国际研究生院、腾讯人工智能实验室、香港科技大学、斯坦福大学和香港中文大学的研究人员推出MagicMan,它是一种用于生成人类新视角图像的模型,能够在3D空间中意识到人类的形态和动作。MagicMan通过使用 ...... 阅读全文

    优惠 新型多模态大语言模型LLaVaOLMoBitNet1B:首个能够处理图像和文本输入并产生连贯文本响应的三元(Ternary)多模态大型语言模型

  • 新型多模态大语言模型LLaVaOLMoBitNet1B:首个能够处理图像和文本输入并产生连贯文本响应的三元(Ternary)多模态大型语言模型
    AI
  • 英特尔实验室推出新型多模态大语言模型LLaVaOLMoBitNet1B,它是首个能够处理图像和文本输入并产生连贯文本响应的三元(Ternary)多模态大型语言模型。这种模型通过使用三元权重量化技术,旨在实现在较小的计算成本上 ...... 阅读全文

    优惠 量化新技术MobileQuant:解决在移动设备上部署大语言模型时面临的内存、能源和计算成本问题

  • 量化新技术MobileQuant:解决在移动设备上部署大语言模型时面临的内存、能源和计算成本问题
    AI
  • 三星剑桥人工智能中心推出量化新技术MobileQuant,它旨在解决在移动设备上部署大语言模型(LLMs)时面临的内存、能源和计算成本问题。大型语言模型虽然在多种应用中表现出色,但要在手机等边缘设备上使用它们却存在 ...... 阅读全文

    优惠 新型服务框架NanoFlow:通过利用设备内部的并行性,显著提高大语言模型的推理吞吐量

  • 新型服务框架NanoFlow:通过利用设备内部的并行性,显著提高大语言模型的推理吞吐量
    AI
  • 华盛顿大学的研究人员推出新型服务框架NanoFlow,它旨在通过利用设备内部的并行性,显著提高大语言模型(LLMs)的推理吞吐量。在当今数字化时代,大型语言模型被广泛应用于聊天机器人、搜索引擎和办公软件等领域,对 ...... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?