TextSquare

优惠 基于文本的视觉问答模型TextSquare

  • 基于文本的视觉问答模型TextSquare
    AI
  • 来自字节跳动、华东师范大学和华中科技大学的研究人员推出TextSquare系统,这是一个基于文本的视觉问答(VQA)模型,它利用了大型多模态语言模型(MLLMs)。TextSquare通过一个新颖的方法生成了一个大规模、高质量的指令调整数据集,称为Square-10M,这个数据集是通过使用闭源的MLLMs生成的。这项工... 阅读全文