AI绘画

优惠 BetterDepth:用来提升单目深度估计的性能

  • BetterDepth:用来提升单目深度估计的性能
    AI
  • 苏黎世联邦理工学院和迪士尼搜索研究部门的研究人员推出BetterDepth,它是用来提升单目深度估计(Monocular Depth Estimation, MDE)的性能。单目深度估计是一种计算机视觉任务,它的目标是通过分析一张图片来猜测物体距离相机的远近,这有点像我们人眼观察世界时,能够感知物体的深度和距离。 例如... 阅读全文

    优惠 基准测试Visual Haystacks:模拟了现实世界的场景,要求模型不仅要找到包含答案的图片,还要利用视觉内容进行推理来回答具体问题

  • 基准测试Visual Haystacks:模拟了现实世界的场景,要求模型不仅要找到包含答案的图片,还要利用视觉内容进行推理来回答具体问题
    AI
  • 加州大学伯克利分校的研究人员发布论文,论文的主题是关于如何让计算机更好地回答关于多张图片集合的问题,这在现实世界中非常有用,比如在翻看大量照片、网上搜索特定信息,或者通过卫星图像监控环境变化时。我们可以把这个问题想象成在一堆干草中找到一根针,但更难,因为需要在很多堆干草中找到答案。 论文还提到了他们创建的Visual ... 阅读全文

    优惠 DataDream:通过少量的真实图像(即“少样本”或“few-shot”数据)来指导生成更真实、更多样化的训练数据集

  • DataDream:通过少量的真实图像(即“少样本”或“few-shot”数据)来指导生成更真实、更多样化的训练数据集
    AI
  • DataDream是一个框架,它通过少量的真实图像(即“少样本”或“few-shot”数据)来指导生成更真实、更多样化的训练数据集。这在图像分类任务中尤其有用,因为有时候我们手头只有很少的样本,但需要训练一个能够识别多种类别的模型。例如,你是一位艺术家,但只有几幅画作为参考。你希望能够创作出更多风格相似、细节丰富的画作... 阅读全文

    优惠 昆仑推出新型图像生成模型DiT-MoE

  • 昆仑推出新型图像生成模型DiT-MoE
    AI
  • 昆仑推出新型图像生成模型DiT-MoE,这个模型的全称是“Diffusion Transformers with Mixture of Experts”。简单来说,它是一种能够生成高质量图像的人工智能系统。它通过模拟一个逐步去噪和降噪的过程,将随机噪声转化为目标数据分布,从而生成图像。例如,你有一个超级聪明的机器人,它... 阅读全文

    优惠 提升个性化图像美学评估的规模化能力

  • 提升个性化图像美学评估的规模化能力
    AI
  • 韩国科学技术院发布论文,论文的主题是关于如何提升个性化图像美学评估的规模化能力。简单来说,就是教会计算机如何根据个人的喜好来评估一张图片是否美观。这项技术可以想象成一个能够理解每个人审美偏好的智能助手。例如,你是一名摄影师,你希望从你拍摄的照片中挑选出最具视觉冲击力的作品。你可以上传一些你认为美观的照片给这个系统,系统... 阅读全文

    优惠 大型图像描述数据集PixelProse:包含了超过1600万个由先进的视觉-语言模型自动生成的图像描述

  • 大型图像描述数据集PixelProse:包含了超过1600万个由先进的视觉-语言模型自动生成的图像描述
    AI
  • 马里兰大学帕克分校的研究人员推出大型图像描述数据集PixelProse,PixelProse包含了超过1600万个由先进的视觉-语言模型自动生成的图像描述。例如,一个艺术家想要了解他的画作在视觉上给人的感受,PixelProse可以帮助分析图像的美学属性并生成描述,这样艺术家就可以得到关于作品可能给观众带来的情感体验的... 阅读全文

    优惠 快手开放自研文生图大模型“可图”

  • 快手开放自研文生图大模型“可图”
    AI
  • 快手正式对外发布了其自主研发的文生图大模型“可图”,支持用户进行AI创作图像以及AI形象定制。这是快手首次将其自研的大模型向公众开放。用户可通过“可图”微信小程序和网页版使用。这也是快手首次将其自研的系列大模型对外开放。报道援引知情人士消息称,“可图”大模型的参数规模达十亿级,这些数据来自开源社区、快手内部构建和自研 ... 阅读全文

    优惠 Adobe Research推出一种使用文生图模型进行高效概念驱动生成的方法,即个性化残差和基于局部注意力的引导采样

  • Adobe Research推出一种使用文生图模型进行高效概念驱动生成的方法,即个性化残差和基于局部注意力的引导采样
    AI
  • Adobe Research推出一种使用文本到图像扩散模型进行高效概念驱动生成的方法,即个性化残差和基于局部注意力的引导采样。它通过训练一个预设的文本条件扩散模型,学习模型部分层的小秩残差(low-rank residuals),来实现高效的概念驱动生成。简单来说,就是教会一个计算机程序,如何根据用户输入的文字描述(比... 阅读全文

    优惠 新型低光照增强技术LighTDiff:专门用于改善手术内窥镜图像的质量

  • 新型低光照增强技术LighTDiff:专门用于改善手术内窥镜图像的质量
    AI
  • 来自澳大利亚悉尼大学电气工程学院、香港中文大学电子工程学系、香港中文大学深圳研究院、山东大学齐鲁医院的研究人员推出新型低光照增强技术LighTDiff,它专门用于改善手术内窥镜图像的质量。在进行微创手术时,内窥镜提供的图像质量对于医生来说是至关重要的,但在低光照条件下,图像往往难以提供足够的细节,影响手术的精确性和安全... 阅读全文

    优惠 Adobe Research推出LogoMotion:基于大语言模型自动为静态布局生成动画

  • Adobe Research推出LogoMotion:基于大语言模型自动为静态布局生成动画
    AI
  • Adobe Research推出LogoMotion,它是一个基于大语言模型(LLM)的方法,能够自动为静态布局生成动画。这个过程是内容感知的,意味着动画的生成会考虑到布局中的视觉内容和结构。LogoMotion通过两个阶段来实现:视觉上下文的程序合成和程序修复。LogoMotion展示了如何将大型语言模型应用于复杂的... 阅读全文

    优惠 通过使用先进的潜在扩散模型和ControlNet技术,从脑电图数据中解码音乐信息,为音乐生成和脑机接口领域提供了新的视角和可能性

  • 通过使用先进的潜在扩散模型和ControlNet技术,从脑电图数据中解码音乐信息,为音乐生成和脑机接口领域提供了新的视角和可能性
    AI
  • 来自威尼斯福斯卡里大学、罗马第一大学和索尼 CSL的研究人员发布论文,探索使用潜在扩散模型(latent diffusion models)从脑电图(EEG)数据中重建自然主义音乐。脑电图是一种记录大脑活动的技术,而自然主义音乐指的是包含多种乐器、声音和效果的复杂音乐,这类音乐在和声和音色上都很丰富。 主要功能: 该研... 阅读全文

    优惠 华擎科技推出AI软件工具AI QuickSet ,轻松安装 Stable Diffusion,支持 OpenVINO

  • 华擎科技推出AI软件工具AI QuickSet ,轻松安装 Stable Diffusion,支持 OpenVINO
    AI
  • 华擎科技近期推出了专为英特尔锐炫 Arc A 系列显卡设计的 AI QuickSet 软件工具,这一举措进一步扩展了其在 AI 应用领域的软件支持。以下是关于这一更新的详细信息: AI QuickSet 软件工具简介 发布时间:去年底首次发布,最近更新支持英特尔 Arc A 系列显卡。 操作系统支持:最初支持 Wind... 阅读全文