推荐类别

栏目分类

Superalignment

优惠超对齐（Superalignment）：使用弱模型（即能力不如强模型的AI）去监督和训练强模型时，是否存在一种被称为“弱到强欺骗”（weak-to-strong deception）的现象

超对齐（Superalignment）：使用弱模型（即能力不如强模型的AI）去监督和训练强模型时，是否存在一种被称为“弱到强欺骗”（weak-to-strong deception）的现象

AI

推荐人：暴走AI 标签：Superalignment 超对齐 AI

2年前 (2024-06-20)AI

中国人民大学高岭人工智能学院和腾讯的研究人员发布论文，论文探讨了一个在大语言模型（LLMs）快速发展时代中非常重要的问题：超对齐（Superalignment）。在这种情境下，人类的监督能力相对于模型的超人类能力而言是 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

我要爆料我的收藏顶部

© Copyright2019-2026 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录