微软亚洲研究院的中国研究人员周二发布了一个新的 AI 模型 WizardLM-2-7B,权重发布在 Hugging Face 平台上。但几小时后微软就将其从平台上移除。研究人员解释说,原因是他们意外错过了微软发布新模型前要求进行的安全测试步骤。一位知情人士表示,微软的 AI 政策要求,在发布任何 AI 模型前,必须首先... 阅读全文
Tinkoff推出新方法Trust Region Direct Preference Optimization(TR-DPO),它用于改进大语言模型(LLMs)的对齐问题。在自然语言处理(NLP)中,对齐问题是指训练模型以生成不仅有效而且安全、可控的输出。例如,当你使用聊天机器人时,你希望它提供有帮助、准确且不会造成伤... 阅读全文