人工智能
优惠 Google DeepMind推出新型基准测试NATURAL PLAN:专门用来评估大语言模型在处理自然语言描述的计划任务方面的能力
1年前 (2024-06-11)AI
Google DeepMind推出新型基准测试NATURAL PLAN,它专门用来评估大语言模型(LLMs)在处理自然语言描述的计划任务方面的能力。这个基准测试包含三个关键任务:旅行规划、会议规划和日历安排。论文的核心思想是,通过提供像Google Flights、Google Maps和Google Calendar... 阅读全文
优惠 思维缓冲区Buffer of Thoughts:用于增强大语言模型(LLMs)推理能力的方法
1年前 (2024-06-07)AI
北京大学、加州大学伯克利分校和斯坦福大学的研究人员推出名为“Buffer of Thoughts”(BoT,即“思维缓冲区”)的新技术,它是一种用于增强大语言模型(LLMs)推理能力的方法。这项技术的核心思想是通过存储一系列高级的“思维模板”(thought-template),来提高模型在处理各种任务时的准确性、效率... 阅读全文