推荐类别

栏目分类

优惠 浦语·灵笔2系列新模型InternLM-XComposer2-4KHD:在处理图像和文本方面有着显著的进步

  • 浦语·灵笔2系列新模型InternLM-XComposer2-4KHD:在处理图像和文本方面有着显著的进步
    AI
  • 上海人工智能实验室推出浦语·灵笔2系列新模型InternLM-XComposer2-4KHD,这是一款开创性大型视觉-语言模型(LVLM),这个模型在处理图像和文本方面有着显著的进步。例如,你有一个能够理解图片内容并回答有关图片问题的智能助手,这就是这个模型的基本功能。InternLM-XComposer2-4KHD是... 阅读全文

    优惠 LLM2Vec:将大型的解码器模型转换成强大的文本编码器

  • LLM2Vec:将大型的解码器模型转换成强大的文本编码器
    AI
  • 这篇论文介绍了一个名为LLM2Vec的方法,它能够将大型的解码器模型(decoder-only LLMs)转换成强大的文本编码器。这些解码器模型在很多自然语言处理(NLP)任务中都是最先进的,但在文本嵌入任务中,它们的能力还没有得到充分利用。文本嵌入任务需要模型能够生成丰富的上下文化表示,而传统的解码器模型由于其单向(... 阅读全文

    优惠 SambaLingo:针对大语言模型进行多语言适应性调整的研究项目

  • SambaLingo:针对大语言模型进行多语言适应性调整的研究项目
    AI
  • 这篇论文的主题是“SambaLingo”,这是一个针对大型语言模型(LLMs)进行多语言适应性调整的研究项目。简单来说,SambaLingo的目标是让大型语言模型能够理解和生成更多不同语言的文本,弥补目前LLMs在多种语言能力上的差距。例如,如果我们要为一个以英语为中心的模型添加对阿拉伯语的支持,SambaLingo的... 阅读全文

    优惠 CodecLM:用于生成与特定指令分布和大语言模型对齐的高质量合成数据的通用框架

  • CodecLM:用于生成与特定指令分布和大语言模型对齐的高质量合成数据的通用框架
    AI
  • 谷歌云和搜索团队推出CodecLM,它是一个用于生成与特定指令分布和大语言模型(LLMs)对齐的高质量合成数据的通用框架。简单来说,CodecLM就像是一个智能的数据制造工厂,能够根据需要生产出适合训练语言模型的数据。例如,如果我们想要训练一个语言模型来更好地回答关于健康和营养的问题,CodecLM可以生成一系列与健康... 阅读全文

    优惠 大语言模型在处理表格数据时的记忆力和学习能力

  • 大语言模型在处理表格数据时的记忆力和学习能力
    AI
  • 图宾根大学图宾根人工智能中心和微软搜索团队发布论文探讨大语言模型(Large Language Models,简称LLMs)在处理表格数据时的记忆力和学习能力。用通俗的语言来说,就像是研究一个学习了很多知识的智能助手,当它遇到新的或之前学过的问题时,它是如何回忆和应用这些知识的。 主要功能和特点: 记忆力测试: 研究者... 阅读全文

    优惠 多模态模型OmniFusion:结合了大语言模型和视觉模态的适配器,以提高人工智能系统处理和理解文本和图像数据的能力

  • 多模态模型OmniFusion:结合了大语言模型和视觉模态的适配器,以提高人工智能系统处理和理解文本和图像数据的能力
    AI
  • 这篇论文介绍了一个名为OmniFusion的多模态模型,它结合了大型语言模型(LLM)和视觉模态的适配器,以提高人工智能系统处理和理解文本和图像数据的能力。OmniFusion模型在多个视觉-语言基准测试中表现出色,尤其是在视觉问题回答(VQA)任务上,与现有的开源解决方案相比,它能够提供更详细的答案。 GitHub:... 阅读全文

    优惠 MiniCPM: 揭示端侧大语言模型的无限潜力

  • MiniCPM: 揭示端侧大语言模型的无限潜力
    AI
  • 面壁智能与清华大学自然语言处理实验室共同开源的系列端侧大模型MiniCPM,旨在探索在资源有限的情况下,如何有效地训练和部署语言模型。MiniCPM系列包括两个主要模型,分别是拥有1.2亿和2.4亿非嵌入参数的变体。尽管模型规模较小,但它们在各种任务上的表现与大型语言模型(LLMs)相当,甚至在某些情况下能与参数量达到... 阅读全文

    优惠 RWKV推出两个新型的序列模型——Eagle(RWKV-5)和Finch(RWKV-6)

  • RWKV推出两个新型的序列模型——Eagle(RWKV-5)和Finch(RWKV-6)
    AI
  • RWKV推出两个新型的序列模型——Eagle(RWKV-5)和Finch(RWKV-6),它们是在之前RWKV-4模型的基础上进行改进的。这些模型的目标是提高自然语言处理(NLP)任务的效率,同时保持或提升模型的性能。RWKV的架构设计进步体现在多头矩阵值状态和动态递归机制上,这些改进在保持RNN推理效率的同时,也增强... 阅读全文

    优惠 MCC-HO:从单个RGB图像或视频中重建手持物体的三维模型

  • MCC-HO:从单个RGB图像或视频中重建手持物体的三维模型
    AI
  • 这篇论文的主题是关于如何从单个RGB图像或视频中重建手持物体的三维模型。这项技术特别关注在户外环境中,当手遮挡了物体的大部分视线时,如何准确地重建物体的三维结构。论文中提出了一个名为MCC-HO的模型,它结合了大型语言/视觉模型和三维物体数据集的最新进展,以实现这一目标。 主要功能和特点: 手部和物体几何联合重建: M... 阅读全文

    优惠 3D生成建模新技术Hash3D:提高3D模型生成的效率,而不需要重新训练模型

  • 3D生成建模新技术Hash3D:提高3D模型生成的效率,而不需要重新训练模型
    AI
  • 来自新加坡国立大学的研究人员推出3D生成建模新技术Hash3D,这个技术旨在提高3D模型生成的效率,而不需要重新训练模型。在3D建模中,通常需要大量的计算资源和时间来创建高质量的3D对象,特别是当使用复杂的2D扩散模型来生成3D内容时。Hash3D通过一种无需训练的方法,加速了这一过程,使得创建3D模型变得更加快速和高... 阅读全文

    优惠 自适应密度控制(ADC)在3D高斯溅射(3DGS)方法中的局限性

  • 自适应密度控制(ADC)在3D高斯溅射(3DGS)方法中的局限性
    AI
  • Meta发布论文深入探讨了自适应密度控制(ADC)在3D高斯溅射(3DGS)方法中的局限性。3DGS是一种场景表示方法,能够生成高质量、逼真的新颖视图合成结果。ADC被引入用于自动管理3D点基本元素,包括控制加密和修剪操作,但在加密逻辑方面存在某些不足。我们的主要贡献在于,为3DGS提出了一种更加基于原则、以像素误差为... 阅读全文

    优惠 Mistral推出开源大模型Mixtral 8x22b

  • Mistral推出开源大模型Mixtral 8x22b
    AI
  • 在谷歌和OpenAI接连放大招后,Mistral也不甘寂寞,直接释出了开源大模型Mixtral 8x22b,此模型 281.24 GB大小,需要4 张英伟达 A100 或H100显卡,才可以安全高效地运行模型。(PS:Mistral又是直接放磁力链接让大家下载) 磁力链接: magnet:?xt=urn:btih:92... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?