大语言模型

优惠 开放混合专家语言模型OLMoE

  • 开放混合专家语言模型OLMoE
    AI
  • 艾伦人工智能研究所、华盛顿大学和普林斯顿大学的研究人员推出开源、先进的语言模型OLMoE,OLMoE-1B-7B是这个系列中的一个模型,它有70亿个参数,但每个输入令牌仅使用10亿个参数。研究者们在5万亿个令牌上预训练了 ...... 阅读全文

    优惠 新型光学字符识别(OCR)模型GOT

  • 新型光学字符识别(OCR)模型GOT
    AI
  • 阶跃星辰、旷视科技、中国科学院大学和清华大学的研究人员推出新型光学字符识别(OCR)模型GOT,它是迈向OCR-2.0时代的一个尝试。OCR技术简单来说,就是让计算机能够识别图片中的文字,并将其转换成可编辑的文本格式 ...... 阅读全文

    优惠 LongCite:旨在提升大语言模型在长文本环境下生成引用的能力

  • LongCite:旨在提升大语言模型在长文本环境下生成引用的能力
    AI
  • 清华大学和智谱AI的研究人员推出一个名为LongCite的系统,它旨在提升大语言模型(LLMs)在长文本环境下生成引用的能力。LongCite通过让模型能够生成带有精细句子级引用的回答,增强了模型输出的可信度和可验证性。例 ...... 阅读全文

    优惠 新型多模态大语言模型LongLLaVA:专门设计用于高效处理大量图像

  • 新型多模态大语言模型LongLLaVA:专门设计用于高效处理大量图像
    AI
  • 香港中文大学(深圳)和深圳大数据研究院的研究人员推出新型多模态大语言模型LongLLaVA,它专门设计用于高效处理大量图像。这个模型的特点是能够在保持较低内存消耗的同时,处理高达1000张的图像,这在单个高性能GPU ...... 阅读全文

    优惠 新型视频理解框架VideoLLaMB:专门设计来处理和理解长时间视频内容

  • 新型视频理解框架VideoLLaMB:专门设计来处理和理解长时间视频内容
    AI
  • 北京通用人工智能研究院 (BIGAI)、美国加州大学圣克鲁斯分校计算机科学与工程系、北京大学王选计算机技术研究所和通用人工智能国家重点实验室的研究人员推出新型视频理解框架VideoLLaMB,这个框架专门设计来处理和理 ...... 阅读全文

    优惠 基于音频的端到端会话模型Mini-Omni:能够实现实时语音互动

  • 基于音频的端到端会话模型Mini-Omni:能够实现实时语音互动
    AI
  • 清华大学的研究人员推出多模态语言模型Mini-Omni,它能够实时地进行语音交互。想象一下,你有一个智能助手,不仅能理解你说的话,还能用语音回答你的问题,就像和真人对话一样自然。Mini-Omni就是这样一个模型,它能 ...... 阅读全文

    优惠 功能强大、易于使用的开源 RAG 工具kotaemon:为最终用户提供了与文档进行交互的可能,也为开发者提供了构建和定制 RAG 管道的平台

  • 功能强大、易于使用的开源 RAG 工具kotaemon:为最终用户提供了与文档进行交互的可能,也为开发者提供了构建和定制 RAG 管道的平台
    AI
  • kotaemon 是一个基于检索增强生成(RAG)技术的开源工具,它允许用户与文档进行交互式对话。kotaemon 的主要目的是提供一个简洁、可定制且功能丰富的用户界面,以便用户能够在其文档上进行问答,同时也为开发者提供 ...... 阅读全文

    优惠 微调大语言模型新方法CURLoRA

  • 微调大语言模型新方法CURLoRA
    AI
  • 这篇论文介绍了一种名为CURLoRA的新型方法,它用于对大语言模型(LLMs)进行微调。CURLoRA利用了CUR矩阵分解技术,并结合了低秩适应(LoRA)的概念。这种方法主要解决了在持续学习过程中,如何减少模型的灾难性遗忘 ...... 阅读全文

    优惠 为了更好地理解和处理科学文献而设计的AI模型SciLitLLM

  • 为了更好地理解和处理科学文献而设计的AI模型SciLitLLM
    AI
  • 中国科学技术大学和深势科技的研究人员推出一个名为SciLitLLM的人工智能模型,它是为了更好地理解和处理科学文献而设计的。你可以把它想象成一个超级聪明的机器人,它阅读科学文章和论文的能力就像一个科学家或研究 ...... 阅读全文

    优惠 文本风格转换方法StyleRemix:能够将文本重新编写,以故意模糊作者的身份

  • 文本风格转换方法StyleRemix:能够将文本重新编写,以故意模糊作者的身份
    AI
  • 华盛顿大学和艾伦人工智能研究所的研究人员推出文本风格转换方法StyleRemix,它能够将文本重新编写,以故意模糊作者的身份。这项技术对于保护作者隐私非常重要,尤其是在需要匿名讨论、双盲审稿或健康服务等敏感情境 ...... 阅读全文

    优惠 智谱AI和清华大学联合推出新型视觉语言模型家族CogVLM2:专门设计用于理解和处理图像与视频内容

  • 智谱AI和清华大学联合推出新型视觉语言模型家族CogVLM2:专门设计用于理解和处理图像与视频内容
    AI
  • 智谱AI和清华大学联合推出新型视觉语言模型家族CogVLM2,它们专门设计用于理解和处理图像与视频内容。简单来说,这些模型就像是拥有超凡视觉能力的智能助手,它们不仅能“看到”图像和视频里的内容,还能理解这些内容 ...... 阅读全文

    优惠 AnythingLLM :可以在本地电脑一件运行大语言模型的跨平台桌面客户端

  • AnythingLLM :可以在本地电脑一件运行大语言模型的跨平台桌面客户端
    AI
  • AnythingLLM 是一款可以在本地电脑一件运行大语言模型的跨平台桌面客户端,支持 Windows、macOS、Linux,支持自选模型,也可以从软件内下载模型。它还支持嵌入模型、语音、转录,最重要的是可以实现完全离线,不依托 ...... 阅读全文