PingPong

优惠 新型基准测试PingPong:专门用来评估语言模型在角色扮演方面的能力

  • 新型基准测试PingPong:专门用来评估语言模型在角色扮演方面的能力
    AI
  • 独立研究人员Ilya Gusev推出新型基准测试PingPong,它专门用来评估语言模型在角色扮演方面的能力。你可以把它想象成一个高级的“过家家”游戏,但是这里的玩家不是真人,而是人工智能(AI)模型。在这个游戏中,AI模型 ...... 阅读全文