推荐类别

栏目分类

优惠 谷歌推出新模型,用于解决视频中的密集字幕生成问题

  • 谷歌推出新模型,用于解决视频中的密集字幕生成问题
    AI
  • 谷歌发布论文介绍了一种新的模型,用于解决视频中的密集字幕生成问题,即在视频中预测字幕并将其定位在特定的时间段内。理想的字幕生成模型应该能够处理长时间的视频输入,生成丰富、详细的文本描述,并且在处理完整 ...... 阅读全文

    优惠 腾讯推出新型视频理解模型ST-LLM

  • 腾讯推出新型视频理解模型ST-LLM
    AI
  • 腾讯推出新型视频理解模型ST-LLM。ST-LLM的核心思想是将视频内容转化为一系列的空间-时间(spatial-temporal)标记,并将这些标记直接输入到大型语言模型(LLM)中,让模型自己学习如何理解和建模视频序列。这种方法 ...... 阅读全文

    优惠 新型开源多语言大语言模型AURORA-M

  • 新型开源多语言大语言模型AURORA-M
    AI
  • 这篇论文介绍了一个名为AURORA-M的新型开源多语言大型语言模型(LLM),它是为了解决现有开源预训练模型在多语言能力、持续预训练导致的灾难性遗忘问题,以及遵守人工智能安全和发展法规方面的挑战而设计的。总的来 ...... 阅读全文

    优惠 谷歌发布论文探讨如何高效地训练能够理解和处理视觉丰富文档

  • 谷歌发布论文探讨如何高效地训练能够理解和处理视觉丰富文档
    AI
  • 这篇论文的主题是关于如何高效地训练能够理解和处理视觉丰富文档(Visually Rich Documents,简称VRD)的语言模型。VRD是指那些结合了视觉元素(如字体大小、颜色、布局等)和语言信息来传递内容的文档,比如发票、 ...... 阅读全文

    优惠 新型语音大语言模型WavLLM:提高语言模型在处理和理解语音方面的性能

  • 新型语音大语言模型WavLLM:提高语言模型在处理和理解语音方面的性能
    AI
  • 微软发布新型语音大型语言模型WavLLM,它旨在提高语言模型在处理和理解语音方面的性能。WavLLM通过结合两个编码器(Whisper和WavLM)来分别处理语音的语义内容和说话者的身份特征。该模型采用分阶段的课程学习方法, ...... 阅读全文

    优惠 基准测试集LongICLBench:大语言模型在处理长篇幅上下文学习任务时的表现

  • 基准测试集LongICLBench:大语言模型在处理长篇幅上下文学习任务时的表现
    AI
  • 来自滑铁卢大学、卡内基·梅隆大学和Vector Institute探讨了大语言模型(LLMs)在处理长篇幅上下文学习任务时的表现。研究者们发现,尽管LLMs在处理短上下文任务时表现出色,但当上下文长度增加时,它们的性能会显著 ...... 阅读全文

    优惠 英特尔推出多模态基础模型(MMFM)套件LLaVA-Gemma

  • 英特尔推出多模态基础模型(MMFM)套件LLaVA-Gemma
    AI
  • 英特尔推出多模态基础模型(MMFM)套件LLaVA-Gemma,它利用了最近发布的Gemma系列大语言模型(LLMs)。特别是2B参数的Gemma模型,为构建能力强大的小型多模态基础模型提供了机会。LLaVA-Gemma模型在多种评估中表现中 ...... 阅读全文

    优惠 新型大语言模型套件EURUS:针对推理任务进行了优化

  • 新型大语言模型套件EURUS:针对推理任务进行了优化
    AI
  • 来自清华大学、伊利诺伊大学香槟分校、美国东北大学、ModelBest、中国人民大学、北京邮电大学和腾讯的研究人员推出新型大语言模型(LLM)套件EURUS,它专门针对推理任务进行了优化。这些模型在数学、代码生成和逻辑 ...... 阅读全文

    优惠 大语言模型在化学科学领域的应用潜力

  • 大语言模型在化学科学领域的应用潜力
    AI
  • 这篇论文探讨了大语言模型(LLMs)在化学科学领域的应用潜力。LLMs是一类强大的人工智能工具,它们通过分析大量文本数据来理解和生成人类语言。在化学领域,这些模型可以用来预测化学物质的性质、优化化学反应过程, ...... 阅读全文

    优惠 LLM-ABR:通过智能系统自动调整视频流的清晰度,以适应观众的网络速度,确保视频播放的流畅性

  • LLM-ABR:通过智能系统自动调整视频流的清晰度,以适应观众的网络速度,确保视频播放的流畅性
    AI
  • 来自微软研究院、UT 奥斯汀分校和北京大学的研究人员推出LLM-ABR,利用大语言模型(LLMs)来设计适应不同网络特性的自适应比特率(ABR)算法。简单来说,就是通过智能系统自动调整视频流的清晰度,以适应观众的网络 ...... 阅读全文

    优惠 潜在扩散模型扩展特性研究

  • 潜在扩散模型扩展特性研究
    AI
  • 来自谷歌和约翰霍普金斯大学的研究人员探讨了潜在扩散模型(Latent Diffusion Models,简称LDMs)的扩展特性,特别关注了它们在采样效率方面的表现。潜在扩散模型是一种用于生成图像的深度学习模型,可以通过文本描 ...... 阅读全文

    优惠 芬兰研究团队推出大型多语言模型Poro 34B

  • 芬兰研究团队推出大型多语言模型Poro 34B
    AI
  • 来自芬兰的研究人员推出大型多语言模型Poro 34B,它是为了解决小语种语言模型训练数据不足的问题而设计的。Poro 34B是一个拥有340亿参数的模型,它在芬兰语、英语和编程语言的数据上进行了训练,总共使用了一万亿个 ...... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?