当前位置：首页 > 优惠 >大语言模型>文章详情

gemma.cpp：一个轻量级的、独立的 C++ 推理引擎，专为 Google 的 Gemma 基础模型设计

推荐人：暴走AI| 商城: AI | 2年前 (2024-04-21)| 分类：大语言模型 | 热度：579 ℃

已关闭评论

gemma.cpp：一个轻量级的、独立的 C++ 推理引擎，专为 Google 的 Gemma 基础模型设计

gemma.cpp 是一个轻量级的、独立的 C++ 推理引擎，专为 Google 的 Gemma 基础模型设计。这个项目似乎是为了填补现代大型语言模型（LLM）推理引擎和实验性 C++ 推理运行时之间的空白。它旨在为研究人员和开发者提供一个简单、直观且易于嵌入其他项目的工具，以便进行实验和研究。以下是关于 gemma.cpp 项目的一些要点：

轻量级和独立：它是一个不依赖于复杂系统的轻量级工具。
Gemma 模型：支持 Google 的 Gemma 2B 和 7B 模型。
简约实现：项目注重简单直接的实现方式，而不是全面的通用性。
垂直集成模型实现：受到如 ggml、llama.c 和 llama.rs 等垂直集成模型实现的启发。
目标用户：针对需要进行实验和研究的用户，尤其是那些希望在低层次上进行算法和计算共设计的研究者。
易于嵌入和修改：项目设计为易于嵌入其他项目，并且具有较小的依赖性。核心实现大约有 2K 行代码（LoC），加上大约 4K 行的支持实用工具代码。
Google Highway Library：使用该库来利用便携式 SIMD 进行 CPU 推理，以提高性能。
生产环境部署：对于面向生产环境的边缘部署，推荐使用标准的部署路径，如 Python 框架 JAX、Keras、PyTorch 和 Transformers。

此外，还提到了关于模型权重的一些信息：

模型权重来源：可以在 Kaggle 上获取模型权重，包括 gemma.cpp 特定的工件。
2024-04-04 的注意事项：如果使用 2B 模型，需要从 Kaggle 重新下载权重，并确保拥有最新版本（-mqa 或版本 3）。代码正在更改以匹配新权重。如果需要使用旧权重，需要在 configs.h 中将 ConfigGemma2B 改回 kVocabSize = 256128 和 kKVHeads = 8。