大语言模型
优惠 新型深度学习架构MambaMixer,专门设计用于高效处理长序列数据
标签:MambaMixer
AI
2年前 (2024-04-01)AI
这篇论文介绍了一种名为MambaMixer的新型深度学习架构,它专门设计用于高效处理长序列数据。MambaMixer的核心特点是它能够在数据中选择性地混合(mix)和过滤(filter)信息,无论是在时间序列还是图像数据中。这种 ...... 阅读全文
优惠 OPPO发布推出Transformer-Lite:如何在智能手机上高效部署大语言模型
2年前 (2024-04-01)AI
OPPO发布推出Transformer-Lite,探讨如何在智能手机上高效部署大语言模型(LLM)。大语言模型是一种人工智能技术,广泛应用于智能助手、文本摘要、翻译和多模态任务等。然而,由于这些模型通常需要大量的计算能力和 ...... 阅读全文
优惠 阿里推出视觉识别统一框架OMNIPARSER,它能够处理文本识别、关键信息提取和表格识别等任务
标签:OMNIPARSER
AI
2年前 (2024-03-31)AI
阿里推出视觉识别统一框架OMNIPARSER,它能够处理文本识别、关键信息提取和表格识别等任务,OmniParser是阿里读光项目的一部分,目标让AI在阅读、思考和创造上超越人类。想象一下,你有一个扫描的文档或者一张包含文 ...... 阅读全文
优惠 数据框架LlamaIndex:专为基于LLM(大型语言模型)的应用程序而设计
标签:LlamaIndex
AI
2年前 (2024-03-31)AI
LlamaIndex是一个数据框架,专为基于LLM(大型语言模型)的应用程序而设计,这些应用程序可以通过上下文增强技术提升性能。这种采用检索增强生成(Retrieval-Augmented Generation)技术的LLM系统被称为RAG系统。Lla ...... 阅读全文
优惠 受Perplexity启发的开源AI搜索引擎llm-answer-engine
2年前 (2024-03-31)AI
llm-answer-engine是一个受Perplexity启发的开源项目,使用Next.js、Groq、Mixtral、Langchain、OpenAI、Brave以及Serper等技术构建一个搜索引擎。该项目旨在基于用户查询,高效地提供相关的来源、答案、图像、视频 ...... 阅读全文
优惠 阿里通义千问开源首个MoE模型Qwen1.5-MoE-A2.7B
2年前 (2024-03-29)AI
阿里昨日首次宣布开源MoE技术大模型Qwen1.5-MoE-A2.7B,这个模型以现有的Qwen-1.8B模型为基础。Qwen1.5-MoE-A2.7B激活参数为2.7亿,但在一系列基准评估中可以达到7B模型的性能。此外,与7B模型相比,它在训练成本和 ...... 阅读全文
优惠 Pico MLX Server:轻松入门苹果MLX AI框架的最佳选择
2年前 (2024-03-28)AI
Pico MLX Server为MLX Server提供了直观的图形用户界面(GUI),让您能够轻松操作。而MLX server则通过提供符合OpenAI API的本地MLX模型API,让您能够轻松整合现有的OpenAI聊天客户端。 亮点功能 快速启动与停止服务 ...... 阅读全文













