新型的多任务信息提取模型GLiNER(Generalist Lightweight model for Information Extraction and Named Entity Recognition),这个模型旨在通过一个小规模的编码器(encoder)模型,实现对各种信息提取任务的有效处理,包括命名实体识别(... 阅读全文
HARE 是由中国电信股份有限公司贵州分公司 LiteAI 团队开发的预训练模型,我们使用约600B Tokens的高质量开源和策略生成的合成数据作为预训练数据。论文的主题是探讨如何通过利用人类先验知识(human priors)来提高小型语言模型(Small Language Models,简称SLMs)的效率和性能... 阅读全文