大语言模型
优惠 NeedleBench框架:用来测试大语言模型处理长文本的能力
标签:NeedleBench
AI
2年前 (2024-07-17)AI
上海人工智能实验室和清华大学的研究人员推测NeedleBench框架,它专门用来测试大语言模型处理长文本的能力。这个框架通过设计一系列越来越具挑战性的任务,评估模型在处理多语言长文本时的检索和推理能力。这些任务 ...... 阅读全文
优惠 阿里巴巴推出新型工具套件“Data-Juicer Sandbox”:促进多模态数据和生成模型的协同开发
2年前 (2024-07-17)AI
阿里巴巴推出新型工具套件“Data-Juicer Sandbox”,它旨在促进多模态数据和生成模型的协同开发。多模态数据指的是包含文本、图像、视频和音频等多种类型的数据。生成模型则是指能够基于输入数据生成新内容的人工智能 ...... 阅读全文
优惠 新型多模态大语言模型DenseFusion-1M:通过融合多种视觉专家的知识来增强对复杂视觉元素的理解能力
2年前 (2024-07-13)AI
北京大学、北京人工智能研究院和大连理工大学的研究人员推出一种新型多模态大型语言模型DenseFusion-1M,它通过融合多种视觉专家的知识来增强对复杂视觉元素的理解能力。这些模型能够理解图像中的多个对象、文本信息 ...... 阅读全文
优惠 专门为视觉应用设计的新型混合模型架构MambaVision
标签:MambaVision
AI
2年前 (2024-07-13)AI
英伟达推出一种新型的混合模型架构——MambaVision,它是专门为视觉应用设计的。MambaVision的核心贡献在于重新设计了Mamba公式,以增强其对视觉特征的高效建模能力。此外,论文还对将视觉变换器(ViT)与Mamba集成的 ...... 阅读全文
优惠 Multimodal Self-Instruct:多模态大语言模型在理解和推理抽象图像方面的能力
2年前 (2024-07-13)AI
浙江大学的研究人员发布论文,论文的主题是关于如何提高大型多模态模型(LMMs)在理解和推理抽象图像方面的能力。多模态模型是一种人工智能技术,它能够处理和理解多种类型的数据,如文本、图像等。然而,尽管这些模 ...... 阅读全文
优惠 智谱AI推出新型视频理解模型CogVLM2-Video:更准确地理解和回答与视频内容相关的问题
标签:CogVLM2-Video
AI
2年前 (2024-07-12)AI
智谱AI推出一种新型视频理解模型——CogVLM2-Video。该模型针对现有技术中的一些限制进行了改进,旨在更准确地理解和回答与视频内容相关的问题。CogVLM2-Video模型结合了新生成的数据集和现有的开放领域问答数据。该模 ...... 阅读全文













