推荐类别

栏目分类

ReMiss

优惠 ReMiss：大语言模型在经过安全和可靠性训练后，为何仍然容易受到敌意攻击

ReMiss：大语言模型在经过安全和可靠性训练后，为何仍然容易受到敌意攻击

AI

推荐人：暴走AI 标签：ReMiss 越狱 AI

2年前 (2024-06-24)AI

香港大学和华为诺亚方舟实验室的研究人员发布论文，论文的主题是探讨大语言模型（LLMs）在经过安全和可靠性训练（alignment）后，为何仍然容易受到敌意攻击（adversarial attacks），特别是所谓的“越狱”（jailbreaki ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

我要爆料我的收藏顶部

© Copyright2019-2026 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录