推荐类别

栏目分类

优惠 基于 Cloudflare Pages 和 R2 的轻量级文件床和在线剪贴板FileWorker

  • 基于 Cloudflare Pages 和 R2 的轻量级文件床和在线剪贴板FileWorker
    工具
  • FileWorker是一个基于 Cloudflare Pages 和 R2 的轻量级文件床和在线剪贴板,也能当图床来用。... 阅读全文

    情报 腾讯发布 GiiNEX AI 游戏引擎:面向 AI NPC、场景制作与内容生成

  • 腾讯发布 GiiNEX AI 游戏引擎:面向 AI NPC、场景制作与内容生成
  • 腾讯近日在 GDC 2024 游戏开发者大会上,发布了 AI Lab 团队打造的 GiiNEX AI 游戏引擎,基于生成式 AI 和决策 AI 技术。腾讯表示,GiiNEX AI 游戏引擎面向 AI NPC、场景制作、内容生成等场景,提供了包括 2D 图像、动画、3D 城市、剧情、对话、关卡以及音乐等 AIGC 能力,... 阅读全文

    精选 2024 年选购相机 SD 卡的注意事项,这些SD 卡值得推荐!

  • 2024 年选购相机 SD 卡的注意事项,这些SD 卡值得推荐!
  • 选择一张好的 SD 卡对于相机来说至关重要。不管你是需要大容量存储、超快的读写速度,还是希望性价比更高以节省开支,我们都为你挑选了市面上最佳的 SD 卡。 2024 年选购 SD 卡的注意事项 不管你是摄影爱好者、视频博主还是专业摄影师,相机里都需要一张靠谱的存储卡。面对各种专业术语和速度等级,了解哪些是真正优质的 S... 阅读全文

    情报 Stability AI即将失去关键技术人员,科研领军人物Robin Rombach即将离职

  • Stability AI即将失去关键技术人员,科研领军人物Robin Rombach即将离职
  • 今天,多家国外科技媒体纷纷报道,Stability AI正面临重大人事变动,即将失去一位至关重要的技术人员。据接近该公司的两位消息人士透露,研究科学家Robin Rombach即将辞去他在Stability AI科研团队的领导职位。 Robin Rombach于2022年加入这家位于伦敦的初创企业,他的离去无疑将对St... 阅读全文

    优惠 轻量级视觉模型EfficientVMamba:结合了全局和局部特征提取能力的网络架构

  • 轻量级视觉模型EfficientVMamba:结合了全局和局部特征提取能力的网络架构
    AI
  • 来自悉尼大学的研究团队论文介绍了一种名为EfficientVMamba的轻量级视觉模型,它是一种结合了全局和局部特征提取能力的网络架构。想象一下,你有一个超级助手,它能够在保持图像细节的同时,快速地从大量图片中识别出不同的物体。EfficientVMamba就像这样一个助手,但它专注于图像处理和识别任务。 主要功能和特... 阅读全文

    优惠 新型光学流估计架构NeuFlow:在机器人和其他边缘设备上实时、高精度估计图像中物体运动的技术

  • 新型光学流估计架构NeuFlow:在机器人和其他边缘设备上实时、高精度估计图像中物体运动的技术
    AI
  • 这篇论文介绍了一种名为NeuFlow的新型光学流估计架构,这是一种在机器人和其他边缘设备上实时、高精度估计图像中物体运动的技术。光学流估计在计算机视觉领域扮演着重要角色,它帮助我们理解图像中物体是如何移动的,这对于机器人定位、地图构建、物体追踪和活动识别等应用至关重要。 主要功能: NeuFlow的主要功能是提供一种既... 阅读全文

    优惠 创新模型Uni-SMART:万能的科学多模态分析和研究转换器,专门设计用于深入理解科学文献中的多模态内容

  • 创新模型Uni-SMART:万能的科学多模态分析和研究转换器,专门设计用于深入理解科学文献中的多模态内容
    AI
  • 这篇论文介绍了一个名为Uni-SMART的创新模型,它是一个万能的科学多模态分析和研究转换器,专门设计用于深入理解科学文献中的多模态内容。随着科学知识的快速增长,学术论文的数量急剧增加,这使得深入分析文献变得既耗时又具有挑战性。Uni-SMART通过结合大型语言模型(LLMs)的强大文本总结能力和对多模态元素(如分子结... 阅读全文

    优惠 VideoAgent:模仿人类理解长视频的认知过程,使用大语言模型作为中心代理,来迭代地识别和编译关键信息以回答问题

  • VideoAgent:模仿人类理解长视频的认知过程,使用大语言模型作为中心代理,来迭代地识别和编译关键信息以回答问题
    AI
  • 这篇论文介绍了一个名为VideoAgent的系统,它模仿人类理解长视频的认知过程,使用大型语言模型(LLM)作为中心代理,来迭代地识别和编译关键信息以回答问题。VideoAgent将视频理解过程视为一系列状态、动作和观察的序列,并通过与视觉语言模型(VLM)和对比语言-图像模型(CLIP)的交互来获取和处理视觉信息。 ... 阅读全文

    优惠 多模态智能代理VideoAgent:为了更好地理解和解释视频内容而设计

  • 多模态智能代理VideoAgent:为了更好地理解和解释视频内容而设计
    AI
  • 这篇论文介绍了一个名为VideoAgent的多模态智能代理,它是为了更好地理解和解释视频内容而设计的。想象一下,你有一个视频,里面有很多人和物体在移动,还有很多事情发生。VideoAgent就像一个超级助手,能够理解视频中的内容,并回答关于视频的问题。 主要功能: VideoAgent的主要功能是视频理解。它可以分析视... 阅读全文

    优惠 新型模型MindEye2:能够从大脑活动(fMRI)中重建出人们所看到的视觉图像

  • 新型模型MindEye2:能够从大脑活动(fMRI)中重建出人们所看到的视觉图像
    AI
  • 这篇论文介绍了一个名为MindEye2的新型模型,它能够从大脑活动(fMRI)中重建出人们所看到的视觉图像。这个模型的出现,标志着我们离理解人类视觉感知的神经基础又近了一步。MindEye2的创新之处在于,它能够使用仅有1小时的fMRI训练数据,就能产生高质量的图像重建结果。例如,如果我们想要了解一个观看自然风景图片的... 阅读全文

    优惠 大型多模态模型LLaVA-UHD:能够高效地处理任意宽高比和高分辨率的图像

  • 大型多模态模型LLaVA-UHD:能够高效地处理任意宽高比和高分辨率的图像
    AI
  • 来自清华大学、新加坡国立大学和中国科学院大学推出大型多模态模型LLaVA-UHD,它能够高效地处理任意宽高比和高分辨率的图像。在现实世界中,图像的宽高比和分辨率多种多样,这对于大型多模态模型(LMMs)在理解和处理视觉信息时提出了挑战。现有的LMMs通常只能处理固定宽高比和低分辨率的图像,这会导致图像内容的严重形变和模... 阅读全文

    优惠 IBM推出新型大语言模型Larimar:通过引入一个分布式的情节记忆系统来增强LLM的能力

  • IBM推出新型大语言模型Larimar:通过引入一个分布式的情节记忆系统来增强LLM的能力
    AI
  • IBM推出新型大语言模型Larimar,它通过引入一个分布式的情节记忆系统来增强LLM的能力。Larimar的记忆系统允许动态、一次性地更新知识,而不需要进行计算成本高昂的重新训练或微调。例如,如果我们有一个提供天气预报的AI助手,当一个新的风暴形成时,我们希望能够快速更新模型的天气预报数据。使用Larimar,我们可... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?