当前位置：首页 > 优惠 >大语言模型>文章详情

Inheritune：用于从现有的大型基础语言模型中开发小型基础语言模型

推荐人：暴走AI| 商城: AI | 1年前 (2024-04-15)| 分类：大语言模型 | 热度：274 ℃

已关闭评论

Inheritune：用于从现有的大型基础语言模型中开发小型基础语言模型

AI

德克萨斯大学奥斯汀分校的研究人员推出简单方法Inheritune，用于从现有的大型基础语言模型（LM）中开发小型基础语言模型。这种方法的核心思想是：首先从大型LM中继承几个变压器块（层），然后在非常小的数据集（例如，原始预训练数据的0.1%）上训练这个小型模型。这个过程类似于从父母那里继承基因，然后用有限的资源（如食物和关怀）培养出一个健康的孩子。

GitHub：https://github.com/sanyalsunny111/LLM-Inheritune
论文：https://arxiv.org/abs/2404.08634

主要功能和特点：

数据和计算效率： Inheritune方法能够在极少的数据和计算资源下训练出性能良好的小型LM。
快速训练： 使用单个A6000 GPU，不到半天的时间就能训练出一个拥有15亿参数的小型LM。
竞争力： 即便训练数据少，通过Inheritune训练出的小型LM在多个评估数据集上的表现与使用更多数据训练的模型相当。

工作原理：

继承层： 从大型参考LM中选取前几层作为小型目标模型的初始层。
训练： 使用一个很小的数据集对目标模型进行多次迭代训练。

具体应用场景：

资源受限的研究和小型企业： 由于不需要大量的计算资源和数据，Inheritune使得研究者和小型企业能够开发出定制的小型LM。
特定任务的微调： 开发出的小型LM可以针对特定任务进行微调，以提高在该任务上的表现。
部署成本敏感的应用： 对于需要在成本较低的硬件上部署LM的应用，小型LM可能是一个更可行的选择。

总的来说，Inheritune提供了一种高效的方法来开发小型LM，这对于资源有限或需要快速迭代模型的场合特别有用。这种方法通过利用大型LM的知识和少量数据，实现了在有限资源下也能训练出有竞争力的模型。

Inheritune

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇：视觉基础模型是否具有对三维结构的认识能力

下一篇：新型神经辐射场（NeRF）方法MonoPatchNeRF：旨在通过单目引导来改进3D模型的几何精度

0条评论

暂时木有评论

猜你喜欢

查看更多商品

我要爆料我的收藏顶部

© Copyright2019-2024 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录