推荐类别

栏目分类

优惠 腾讯发布基准测试工具SEED-Bench-2-Plus:专门用于评估多模态大语言模型在处理富含文本的视觉内容方面的性能

  • 腾讯发布基准测试工具SEED-Bench-2-Plus:专门用于评估多模态大语言模型在处理富含文本的视觉内容方面的性能
    AI
  • 腾讯发布基准测试工具SEED-Bench-2-Plus,它专门用于评估多模态大语言模型(MLLMs)在处理富含文本的视觉内容方面的性能。这类场景在现实世界中非常普遍,例如图表、地图和网页等,它们都包含了大量的文本信息嵌入在图像中。 主要功能和特点: 针对性的评估:SEED-Bench-2-Plus包含2.3K个多项选择... 阅读全文

    优惠 开源多模态大语言模型InternVL 1.5,旨在缩小开源模型与商业专有模型在多模态理解能力方面的差距

  • 开源多模态大语言模型InternVL 1.5,旨在缩小开源模型与商业专有模型在多模态理解能力方面的差距
    AI
  • 来自上海人工智能实验室、商汤科技研究院、清华大学、南京大学、复旦大学和香港中文大学的研究人员推出开源多模态大语言模型InternVL 1.5,旨在缩小开源模型与商业专有模型在多模态理解能力方面的差距。多模态大语言模型结合了视觉和语言处理的能力,可以处理包含文本和图像的任务,比如解释图片内容、理解文档中的文本等。 Git... 阅读全文

    优惠 开源多语言大语言模型Tele-FLM:在语言理解和生成方面展现了卓越的能力,支持广泛的应用场景

  • 开源多语言大语言模型Tele-FLM:在语言理解和生成方面展现了卓越的能力,支持广泛的应用场景
    AI
  • 北京人工智能研究院、中国电信股份有限公司人工智能研究院(TeleAI)和新加坡南洋理工大学计算机科学与工程学院的研究人员推出开源多语言大语言模型Tele-FLM(也称为FLM-2),Tele-FLM在语言理解和生成方面展现了卓越的能力,支持广泛的应用场景。 如果你正在开发一个多语言的聊天机器人,需要它能够理解和回应不同... 阅读全文

    优惠 Meta推出LayerSkip:加速大语言模型的推理过程

  • Meta推出LayerSkip:加速大语言模型的推理过程
    AI
  • Meta推出LayerSkip,它旨在加速大语言模型(LLMs)的推理过程。大语言模型是人工智能领域的一项先进技术,它们能够理解和生成人类语言,广泛应用于自动翻译、文本摘要、问答系统等多种场景。然而,这些模型通常需要大量的计算资源,导致在实际部署时面临高成本和能耗的挑战。 主要功能和特点: 训练时的层dropout和早... 阅读全文

    优惠 改善大语言模型在处理长文本输入时的信息利用问题,解决所谓的“中间丢失”(lost-in-the-middle)挑战

  • 改善大语言模型在处理长文本输入时的信息利用问题,解决所谓的“中间丢失”(lost-in-the-middle)挑战
    AI
  • 来自西安交通大学、微软和北京大学的研究人员发布关于如何改善大语言模型(LLMs)在处理长文本输入时的信息利用问题的论文,特别是解决所谓的“中间丢失”(lost-in-the-middle)挑战。这个问题指的是模型在处理长文本时,往往不能充分利用文本中间部分的信息。 例如: 假设我们有一个包含数千句子的长文档,我们需要模... 阅读全文

    优惠 英伟达推出NeRF-XL:利用多个GPU来扩展神经辐射场(NeRFs)的规模,从而使得训练和渲染具有更大容量的NeRFs成为可能

  • 英伟达推出NeRF-XL:利用多个GPU来扩展神经辐射场(NeRFs)的规模,从而使得训练和渲染具有更大容量的NeRFs成为可能
    AI
  • 英伟达、加州大学伯克利分校和多伦多大学的研究人员推出NeRF-XL,它能够利用多个GPU来扩展神经辐射场(NeRFs)的规模,从而使得训练和渲染具有更大容量的NeRFs成为可能。NeRFs是一种用于3D场景重建和新视角合成的技术,它可以通过一系列的2D图像来重建出3D场景,并从新的视角生成图像。 例如:我们想要从数千张... 阅读全文

    优惠 SoM-LLaVA:提高多模态大语言模型视觉理解能力的新方法,它通过在图像上添加带标签的标记(tags)来增强模型将视觉对象与文本标记关联的能力

  • SoM-LLaVA:提高多模态大语言模型视觉理解能力的新方法,它通过在图像上添加带标签的标记(tags)来增强模型将视觉对象与文本标记关联的能力
    AI
  • 加州大学圣地亚哥分校、微软公司、加州大学圣巴巴拉分校的研究人员推出list items one by one,这是一种提高多模态大语言模型视觉理解能力的新方法,它通过在图像上添加带标签的标记(tags)来增强模型将视觉对象与文本标记关联的能力。例如,我们有一张包含笔记本电脑、椅子、显示器和台灯的办公室照片。使用SoM提... 阅读全文

    优惠 免费空间服务Easyupload.io:匿名分享文件最大 10 GB、保存 30 天

  • 免费空间服务Easyupload.io:匿名分享文件最大 10 GB、保存 30 天
    工具
  • Easyupload.io作为一款传统的免费空间服务,以其简单易用的界面、大容量支持、匿名使用、灵活设定以及合理的免费用户保存期限,非常适合于临时、匿名、快速分享大文件的场景。然而,用户在选择时应重点考察其上下载速度与稳定性是否满足个人需求,并根据自身对文件保存期限、文件大小限制以及是否愿意付费升级等因素综合判断其是否... 阅读全文

    情报 微软Windows 11 预览版22635.3566(KB5037002)更新概览

  • 微软Windows 11 预览版22635.3566(KB5037002)更新概览
  • 2024年4月26日,微软通过Windows Insider Program在Beta通道中推送了Windows 11版本22635.3566(KB5037002)。在这次更新中,微软主要致力于修复操作系统的多个方面,同时也包含了一些未在官方说明中提及的改进。 关键更新与改进 文件资源管理器增强:新增功能允许用户通过鼠... 阅读全文

    情报 对标Sora!生数科技与清华联合推出视频大模型Vidu

  • 对标Sora!生数科技与清华联合推出视频大模型Vidu
  • 4月27日,在中关村论坛未来人工智能先锋论坛上,生数科技与清华大学联合推出了中国首个人工智能视频大模型——Vidu。这款模型凭借其独特的U-ViT架构(Diffusion与Transformer融合),实现了长时长、高一致性和高动态性的视频生成能力,一键即可创作出长达16秒、1080P高清的视频内容。 二、Vidu性能... 阅读全文

    优惠 阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B

  • 阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B
    AI
  • 阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B。此前它发布了 0.5B、1.8B、4B、7B、14B 和 72B 不同规模参数的版本。阿里巴巴称,Qwen1.5-110B 模型在基础能力评估中与 Meta-Llama3-70B 相媲美,在 Chat 评估中表现出色,包括 MT-Bench 和 Alpaca... 阅读全文

    优惠 喜加一 Epic商店本周免费领取第一人称射击新作《INDUSTRIA》和叙事驱动角色扮演游戏《LISA: Definitive Edition》 ,下周免费游戏为塔防游戏《兽人必须死3》 0元

  • Epic商店本周免费领取第一人称射击新作《INDUSTRIA》和叙事驱动角色扮演游戏《LISA: Definitive Edition》 ,下周免费游戏为塔防游戏《兽人必须死3》
    Epic Games
  • Epic Games本周要免费送第一人称射击新作《INDUSTRIA》和叙事驱动角色扮演游戏《LISA: Definitive Edition》,领取时间为4月25日晚上23点到5月2日晚上23点,在此之前免费领取即可永久保留这些作品,下周免费游戏将是塔防游戏《兽人必须死3(Orcs Must Die! 3)》,领取时... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?