GTA

优惠 新基准测试GTA:评估和提升大语言模型在现实世界场景中使用各种工具的能力

  • 新基准测试GTA:评估和提升大语言模型在现实世界场景中使用各种工具的能力
    AI
  • 上海交通大学和上海人工智能实验室的研究人员推出新基准测试GTA(General Tool Agents),它是为了评估和提升大语言模型(LLMs)在现实世界场景中使用各种工具的能力而设计的。GTA基准测试的主要挑战在于,现有的评 ...... 阅读全文