推荐类别

栏目分类

优惠 新技术GRASS:用于训练大语言模型的高效优化方法

  • 新技术GRASS:用于训练大语言模型的高效优化方法
    AI
  • 卡内基梅隆大学的研究团队推出新技术GRASS(GRAdient Structured Sparsification),它是一种用于训练大语言模型(LLMs)的高效优化方法。GRASS的核心在于利用结构化稀疏梯度来减少训练过程中所需的内存和计算资源,从而提高训练大型语言模型的效率和可扩展性。论文还提到了GRASS的一些实... 阅读全文

    优惠 实时对话模拟器DialSim:专门用来评估对话代理在长期对话中的理解和应对能力

  • 实时对话模拟器DialSim:专门用来评估对话代理在长期对话中的理解和应对能力
    AI
  • 韩国科学技术研究院和首尔国立大学推出实时对话模拟器DialSim,它专门用来评估对话代理(也就是我们通常所说的聊天机器人或者智能助手)在长期对话中的理解和应对能力。想象一下,如果你的智能助手不仅能够流畅地回答你的问题,还能够记住之前的对话内容,并在多天甚至更长时间的对话中保持话题的连贯性,那么这个助手的智能程度就相当高... 阅读全文

    优惠 新型文本句子分割模型SAT:将一大块文本分解成单独的句子

  • 新型文本句子分割模型SAT:将一大块文本分解成单独的句子
    AI
  • 这篇论文介绍了一个名为“Segment Any Text (SAT)”的新型文本句子分割模型。句子分割是自然语言处理(NLP)中的一个基础任务,目的是将一大块文本分解成单独的句子。这项技术对于很多应用来说都非常关键,比如机器翻译、文本摘要、情感分析等。SAT模型在多个数据集上进行了评估,包括不同语言和领域的文本,表现出... 阅读全文

    优惠 自动化数据生成管道APIGen:专门为生成可验证、多样化的函数调用数据集而设计

  • 自动化数据生成管道APIGen:专门为生成可验证、多样化的函数调用数据集而设计
    AI
  • Salesforce AI Research推出APIGen系统,它是一个自动化的数据生成管道,专门为生成可验证、多样化的函数调用数据集而设计。这个系统的目标是提高函数调用代理模型(一种人工智能模型)的性能,这些模型能够根据自然语言指令执行API(应用程序编程接口)调用。使用APIGen生成的数据集训练的模型,在Ber... 阅读全文

    优惠 新型多模态大语言模型MG-LLaVA

  • 新型多模态大语言模型MG-LLaVA
    AI
  • 上海交通大学、上海人工智能实验室和南洋理工大学的研究人员推出新型多模态大语言模型MG-LLaVA,它在视觉理解任务上取得了显著的进步。例如,你有一个能够“看”图片和“读”文字的智能助手,但以前的这种助手只能处理低分辨率的图片,这限制了它们理解细节的能力。MG-LLaVA通过增加多粒度视觉处理能力,比如低分辨率、高分辨率... 阅读全文

    优惠 基于幅度的梯度更新的新方法MIGU:解决语言模型在持续学习中面临的灾难性遗忘问题

  • 基于幅度的梯度更新的新方法MIGU:解决语言模型在持续学习中面临的灾难性遗忘问题
    AI
  • 香港大学 、中国科学院信息与通信技术研究所、香港中文大学深圳分校、清华大学、爱丁堡大学、英伟达和香港科技大学的研究人员推出新方法MIGU(基于幅度的梯度更新,用于持续学习),旨在解决语言模型(LMs)在持续学习(Continual Learning, CL)中面临的灾难性遗忘问题。灾难性遗忘是指模型在学习新知识时会遗忘... 阅读全文

    优惠 YOUDREAM:根据文本描述生成高质量、解剖学上可控且一致的3D动物模型

  • YOUDREAM:根据文本描述生成高质量、解剖学上可控且一致的3D动物模型
    AI
  • 德克萨斯大学奥斯汀分校和马萨诸塞大学阿默斯特分校的研究人员推出创新方法YOUDREAM,它能够根据文本描述生成高质量、解剖学上可控且一致的3D动物模型。YOUDREAM是一个强大的工具,它结合了文本描述、3D姿态控制和先进的神经网络技术,为3D内容创造提供了一个既灵活又准确的解决方案。 项目主页:https://you... 阅读全文

    优惠 Hugging Face推出专门为训练大语言模型而设计的大规模文本数据集FineWeb

  • Hugging Face推出专门为训练大语言模型而设计的大规模文本数据集FineWeb
    AI
  • Hugging Face推出大规模文本数据集FineWeb,它是专门为训练大语言模型而设计的。FineWeb数据集来源于Common Crawl的96个快照,包含15万亿个token,这些数据被用来训练性能更好的LLMs。此外,论文还介绍了FineWeb-Edu,这是一个从FineWeb中筛选出来的、专注于教育文本的子... 阅读全文

    优惠 MemServe:为了提高大语言模型服务的效率而设计

  • MemServe:为了提高大语言模型服务的效率而设计
    AI
  • 华为云,北京大学的研究人员推出MemServe,它是为了提高大语言模型(LLM)服务的效率而设计的。想象一下,大语言模型就像一个非常聪明的机器人,它可以阅读和理解人类的语言,并用它来回答问题或生成文本。但是,这些模型非常大,运行它们需要很多计算资源。MemServe就是用来帮助更高效地管理和运行这些大型模型的。总的来说... 阅读全文

    优惠 新型文本到视频生成基准测试ChronoMagic-Bench

  • 新型文本到视频生成基准测试ChronoMagic-Bench
    AI
  • 新型文本到视频(Text-to-Video, T2V)生成基准测试ChronoMagic-Bench。这个基准测试专门用来评估T2V模型在生成具有显著变化幅度和时间连贯性的延时视频方面的能力。简单来说,ChronoMagic-Bench就像是一个考试,它用来测试视频生成模型是否能够根据文本描述,制作出既符合描述又在视觉... 阅读全文

    优惠 提升观众观看体验!自动足球比赛解说生成模型MatchTime

  • 提升观众观看体验!自动足球比赛解说生成模型MatchTime
    AI
  • 上海交通大学和上海人工智能实验室的研究人员推出自动足球比赛解说生成模型MatchTime,目的是提升观众观看体验。足球作为全球最受欢迎的运动之一,拥有超过35亿的观众。精彩的解说能够为观众提供背景信息、分析和情感上的激动,但制作吸引人且富有洞察力的解说需要相当的专业知识,并且可能资源密集。随着人工智能,尤其是基础视觉-... 阅读全文

    优惠 Math-LLaVA:提升大语言模型在处理多模态数学问题上的能力

  • Math-LLaVA:提升大语言模型在处理多模态数学问题上的能力
    AI
  • 中国电子科技大学、新加坡科技设计大学、同济大学和新加坡国立大学的研究人员推出Math-LLaVA,提升大语言模型(LLMs)在处理多模态数学问题上的能力。多模态数学问题是指那些需要结合图像和文本信息来解决的数学问题,比如根据图表数据计算趋势或者解决几何问题。例如,设有一个图表展示了某地区过去五年的人口增长趋势,Math... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?