优惠 模型手术(Model Surgery):通过直接编辑大语言模型的一小部分参数来调节其行为的方法
1年前 (2024-07-17)AI
清华大学自动化系和卡内基梅隆大学的研究人员推出“模型手术”(Model Surgery),这是一种通过直接编辑大语言模型(LLM)的一小部分参数来调节其行为的方法。这种方法特别适用于希望模型展现出某些理想行为特征,比如无毒性(non-toxicity)和抵抗越狱(jailbreak)尝试的能力。 GitHub:http... 阅读全文
优惠 H2O.ai公司推出小型语言模型H2O-Danube3,可以在手机上运行
标签:H2O-Danube3
AI
1年前 (2024-07-17)AI
H2O-Danube3是由H2O.ai公司推出的一系列小型语言模型。这些模型包括H2O-Danube3-4B和H2O-Danube3-500M,分别在6万亿(T)和4万亿个词元上进行了训练。这些模型的设计理念是能够在现代智能手机等移动设备上高效运行,实现本地推理和快速处理能力。例如,你有一个智能手机应用,需要一个能够理... 阅读全文
优惠 Make-An-Agent:能够生成通用策略网络的系统
标签:Make-An-Agent
AI
1年前 (2024-07-17)AI
马里兰大学帕克分校、清华大学、加州大学圣地亚哥分校的研究人员推出创新方法Make-An-Agent,它是一个能够生成通用策略网络的系统。简单来说,就是通过观察一个智能体(比如机器人)的行为,这个系统能够自动生成控制这个智能体的策略,就像我们通过一段文本描述就能生成图像一样。这种方法大大简化了机器人控制策略的开发过程,使... 阅读全文