推荐类别

栏目分类

优惠 新型大型多模态模型LLaVA-OneVision:提高计算机视觉任务的性能,特别是在处理单图像、多图像和视频场景时的能力

  • 新型大型多模态模型LLaVA-OneVision:提高计算机视觉任务的性能,特别是在处理单图像、多图像和视频场景时的能力
    AI
  • 这篇论文介绍了一个名为LLaVA-OneVision的新型大型多模态模型(LMMs),它是由多个机构共同开发的,包括字节跳动、南洋理工大学、香港中文大学和香港科技大学。这个模型的核心目标是提高计算机视觉任务的性能,特别是在处理单图像、多图像和视频场景时的能力。例如,你正在使用一个智能助手,你给它发送了一张你在旅行中拍摄... 阅读全文

    优惠 评估基准测试MMIU:专门用于测试和评估大型视觉-语言模型在处理多图像任务时的性能

  • 评估基准测试MMIU:专门用于测试和评估大型视觉-语言模型在处理多图像任务时的性能
    AI
  • 上海人工智能实验室、上海交通大学、香港大学、商汤科技研究部和清华大学的研究人员推出评估基准测试MMIU(Multimodal Multi-image Understanding),它专门用于测试和评估大型视觉-语言模型(LVLMs)在处理多图像任务时的性能。简单来说,MMIU是一个全面的测试套件,它可以检验这些模型是否... 阅读全文

    优惠 ExoViP系统:用于组合视觉推理的验证和探索工具

  • ExoViP系统:用于组合视觉推理的验证和探索工具
    AI
  • 北京国家通用人工智能重点实验室和约翰霍普金斯大学的研究人员推出ExoViP系统,它是一个用于组合视觉推理的验证和探索工具。ExoViP的核心思想是提高复杂视觉任务中人工智能的推理能力,特别是当这些任务需要将复杂的查询转化为一系列可执行的视觉任务时。ExoViP在多个视觉推理任务上的应用,包括视觉问答、图像编辑和视频推理... 阅读全文

    优惠 大规模文本到视频生成数据集VIDGEN-1M:为了提升文本到视频模型的训练效果而特别设计的,它通过精细的筛选和标注过程,提供了高质量的视频和详细的文本描述

  • 大规模文本到视频生成数据集VIDGEN-1M:为了提升文本到视频模型的训练效果而特别设计的,它通过精细的筛选和标注过程,提供了高质量的视频和详细的文本描述
    AI
  • 复旦大学和上海人工智能科学研究院的研究人员推出大规模文本到视频生成数据集VIDGEN-1M,这个数据集是为了提升文本到视频模型的训练效果而特别设计的,它通过精细的筛选和标注过程,提供了高质量的视频和详细的文本描述。例如,你想要制作一个关于海滩日落的视频,你可以给模型一个文本描述,比如“一个男人戴着红帽子,穿着灰色衬衫站... 阅读全文

    优惠 开源框架RAG Foundry:专门用于增强大语言模型,特别是针对检索增强型生成(RAG)的应用场景

  • 开源框架RAG Foundry:专门用于增强大语言模型,特别是针对检索增强型生成(RAG)的应用场景
    AI
  • 英特尔实验室推出开源框架RAG Foundry,它专门用于增强大语言模型(LLMs),特别是针对检索增强型生成(Retrieval-Augmented Generation,简称RAG)的应用场景。简单来说,RAG Foundry是一个多功能工具箱,它可以帮助研究者和开发者通过整合外部信息源来提升语言模型在特定任务上的... 阅读全文

    优惠 MeshAnything V2系统:能够自动生成与给定形状对齐的艺术家创造的网格的模型

  • MeshAnything V2系统:能够自动生成与给定形状对齐的艺术家创造的网格的模型
    AI
  • 洋理工大学、清华大学、伦敦帝国理工学院和西湖大学的研究人员推出MeshAnything V2系统,它是一个能够自动生成与给定形状对齐的艺术家创造的网格(Artist-Created Meshes,简称AM)的模型。简单来说,MeshAnything V2就像一个聪明的3D设计师,可以根据你提供的形状或者描述,自动设计出... 阅读全文

    情报 美国法院判 Google 非法垄断,谷歌或面临解散危机

  • 美国法院判 Google 非法垄断,谷歌或面临解散危机
  • 美国司法部近期对 Google 提出反垄断诉讼,裁决 Google 非法垄断了搜索引擎市场。裁决指出,Google 掌控着高达 90% 的市场份额,并对竞争对手进行了非法打压。目前尚未明确 Google 及其母公司 Alphabet 将面临何种处罚,但 Alphabet 已明确表示将提出上诉。美国司法部试图增强搜索服务... 阅读全文

    情报 AMD Ryzen 9000 系列处理器上市时间与价格信息

  • AMD Ryzen 9000 系列处理器上市时间与价格信息
  • 由于品质问题,AMD 决定将 Ryzen 9000 系列处理器的上市时间延后至8月。现在,AMD 已经明确了产品将分两个批次推出,首批产品将于8月8日上市,而第二批则计划在8月15日发售。 首批发售产品 Ryzen 7 9700X Ryzen 5 9600X 这些中阶和中高阶处理器将首先与消费者见面。 第二批发售产品 ... 阅读全文

    情报 英特尔延长第13/14代酷睿处理器保修期限,OEM、散片通通延长到5年

  • 英特尔延长第13/14代酷睿处理器保修期限,OEM、散片通通延长到5年
  • 针对近期用户反馈的第13/14代酷睿桌面处理器出现的崩溃和不稳定问题,英特尔公司已作出积极回应。该公司承诺将优化售后服务流程,确保用户在更换问题CPU时过程更为简便。 用户解决方案 遇到问题的用户:可立即联系英特尔或OEM厂商更换新的CPU。 尚未遇到问题的用户:将自动获得延长保修服务,未来出现问题时同样可以更换CPU... 阅读全文

    百科 Google Lens 登陆 Chrome 浏览器,教你如何启动它!

  • Google Lens 登陆 Chrome 浏览器,教你如何启动它!
  • Google Lens(谷歌智能镜头)现已登陆 Chrome 浏览器,带来与移动设备上的“Circle to Search(画圈搜索)”相似的全新体验。这不仅提升了网页搜索的便捷性,更利用 AI 技术,让你在浏览过程中,无需离开当前页面即可轻松获取信息。尽管这项功能目前还在逐步推广中,但您可以通过启用实验性功能来提前体... 阅读全文

    优惠 Midjourney「样式参考」功能新助手 —— Midjourney风格代码库 SrefHunter

  • Midjourney「样式参考」功能新助手 —— Midjourney风格代码库 SrefHunter
    工具
  • Midjourney 于今年初推出了全新的“样式参考(Style References)”功能,该功能允许用户通过指定一个或多个图像并使用–sref风格代码来生成具有相同风格但内容不同的新图片。虽然互联网上有不少国外用户分享的示例,但这些资源较为分散,不易查找。 为此,特此介绍一个名为“SrefHunter”的网站。该... 阅读全文

    情报 Arc浏览器现已支持Windows 10

  • Arc浏览器现已支持Windows 10
  • 由The Browser Company精心打造的免费网络浏览器Arc,现已全面支持Windows 10操作系统。不过,请注意,它不兼容微软已停止支持的Windows 10 1809版本。Arc for Windows 11自2024年4月发布以来,受到了广大用户的热烈欢迎。现在,这款功能强大的浏览器也扩展了对Wind... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?