这篇论文介绍了一个名为“Segment Any Text (SAT)”的新型文本句子分割模型。句子分割是自然语言处理(NLP)中的一个基础任务,目的是将一大块文本分解成单独的句子。这项技术对于很多应用来说都非常关键,比如机器翻译、文本摘要、情感分析等。SAT模型在多个数据集上进行了评估,包括不同语言和领域的文本,表现出... 阅读全文
Salesforce AI Research推出APIGen系统,它是一个自动化的数据生成管道,专门为生成可验证、多样化的函数调用数据集而设计。这个系统的目标是提高函数调用代理模型(一种人工智能模型)的性能,这些模型能够根据自然语言指令执行API(应用程序编程接口)调用。使用APIGen生成的数据集训练的模型,在Ber... 阅读全文