当前位置：首页 > 优惠 >大语言模型>文章详情

REALIGN：提升大语言模型（LLMs）与人类价值观的一致性

推荐人：暴走AI| 商城: AI | 2年前 (2024-02-20)| 分类：大语言模型 | 热度：704 ℃

已关闭评论

来自上海交通大学、上海人工智能实验室、复旦大学、马里兰大学帕克分校等研究人员提出一种新方法REALIGN，旨在提升大语言模型（LLMs）与人类价值观的一致性。REALIGN的核心思想是通过改进现有指令数据的质量，而不是从头开始创建新的数据集。这种方法通过三个主要步骤来实现：定义标准、增强检索和重新格式化响应。REALIGN的目标是减少人工标注的需求，同时减少LLMs生成的幻觉内容，并且与现有的对齐技术保持正交。

项目主页：https://gair-nlp.github.io/ReAlign

GitHub地址：https://github.com/GAIR-NLP/ReAlign

论文地址：https://arxiv.org/abs/2402.12219

大语言模型（LLMs）的价值观对齐对于其质量和应用至关重要。实验结果显示，REALIGN显著提高了LLMs的通用对齐能力、数学推理能力、事实准确性和可读性。具体来说，通过仅重新格式化响应，LLaMA-2-13B在GSM8K上的数学推理能力从46.77%提高到了56.63%。此外，仅使用5%的REALIGN数据，即可将Alpaca数据集上的通用对齐能力提高67%。此项研究强调了进一步探索LLMs科学和机理可解释性的必要性。相关代码和数据已公开，以支持未来的研究。

主要功能：

提高LLMs在遵循指令、数学推理、事实性和可读性方面的表现。
通过改进现有数据集，而不是创建新数据集，来提升模型的对齐能力。

主要特点：

定义标准：人类定义各种场景下的偏好，如响应的格式。
增强检索：为知识密集型任务（如开放领域问答和事实验证）提供额外的信息，以提高响应的事实性和信息量。
重新格式化：根据预定义的标准和收集的证据，重新调整响应，确保输出结构化且有依据。

工作原理：

定义标准：首先，人类定义任务和响应格式的标准。
增强检索：对于知识密集型任务，使用搜索引擎API（如Google Search API）检索相关信息作为证据。
重新格式化：利用LLMs（如ChatGPT）根据给定的格式和检索到的证据重新编写响应。对于非知识密集型任务，可能只部分重写；对于知识密集型任务，还会结合检索到的证据。

具体应用场景：