AI绘画

优惠 快手开放自研文生图大模型“可图”

  • 快手开放自研文生图大模型“可图”
    AI
  • 快手正式对外发布了其自主研发的文生图大模型“可图”,支持用户进行AI创作图像以及AI形象定制。这是快手首次将其自研的大模型向公众开放。用户可通过“可图”微信小程序和网页版使用。这也是快手首次将其自研的系列大模型对外开放。报道援引知情人士消息称,“可图”大模型的参数规模达十亿级,这些数据来自开源社区、快手内部构建和自研 ... 阅读全文

    优惠 Adobe Research推出一种使用文生图模型进行高效概念驱动生成的方法,即个性化残差和基于局部注意力的引导采样

  • Adobe Research推出一种使用文生图模型进行高效概念驱动生成的方法,即个性化残差和基于局部注意力的引导采样
    AI
  • Adobe Research推出一种使用文本到图像扩散模型进行高效概念驱动生成的方法,即个性化残差和基于局部注意力的引导采样。它通过训练一个预设的文本条件扩散模型,学习模型部分层的小秩残差(low-rank residuals),来实现高效的概念驱动生成。简单来说,就是教会一个计算机程序,如何根据用户输入的文字描述(比... 阅读全文

    优惠 新型低光照增强技术LighTDiff:专门用于改善手术内窥镜图像的质量

  • 新型低光照增强技术LighTDiff:专门用于改善手术内窥镜图像的质量
    AI
  • 来自澳大利亚悉尼大学电气工程学院、香港中文大学电子工程学系、香港中文大学深圳研究院、山东大学齐鲁医院的研究人员推出新型低光照增强技术LighTDiff,它专门用于改善手术内窥镜图像的质量。在进行微创手术时,内窥镜提供的图像质量对于医生来说是至关重要的,但在低光照条件下,图像往往难以提供足够的细节,影响手术的精确性和安全... 阅读全文

    优惠 Adobe Research推出LogoMotion:基于大语言模型自动为静态布局生成动画

  • Adobe Research推出LogoMotion:基于大语言模型自动为静态布局生成动画
    AI
  • Adobe Research推出LogoMotion,它是一个基于大语言模型(LLM)的方法,能够自动为静态布局生成动画。这个过程是内容感知的,意味着动画的生成会考虑到布局中的视觉内容和结构。LogoMotion通过两个阶段来实现:视觉上下文的程序合成和程序修复。LogoMotion展示了如何将大型语言模型应用于复杂的... 阅读全文

    优惠 通过使用先进的潜在扩散模型和ControlNet技术,从脑电图数据中解码音乐信息,为音乐生成和脑机接口领域提供了新的视角和可能性

  • 通过使用先进的潜在扩散模型和ControlNet技术,从脑电图数据中解码音乐信息,为音乐生成和脑机接口领域提供了新的视角和可能性
    AI
  • 来自威尼斯福斯卡里大学、罗马第一大学和索尼 CSL的研究人员发布论文,探索使用潜在扩散模型(latent diffusion models)从脑电图(EEG)数据中重建自然主义音乐。脑电图是一种记录大脑活动的技术,而自然主义音乐指的是包含多种乐器、声音和效果的复杂音乐,这类音乐在和声和音色上都很丰富。 主要功能: 该研... 阅读全文

    优惠 华擎科技推出AI软件工具AI QuickSet ,轻松安装 Stable Diffusion,支持 OpenVINO

  • 华擎科技推出AI软件工具AI QuickSet ,轻松安装 Stable Diffusion,支持 OpenVINO
    AI
  • 华擎科技近期推出了专为英特尔锐炫 Arc A 系列显卡设计的 AI QuickSet 软件工具,这一举措进一步扩展了其在 AI 应用领域的软件支持。以下是关于这一更新的详细信息: AI QuickSet 软件工具简介 发布时间:去年底首次发布,最近更新支持英特尔 Arc A 系列显卡。 操作系统支持:最初支持 Wind... 阅读全文

    优惠 基于扩散的文生图模型的可扩展性

  • 基于扩散的文生图模型的可扩展性
    AI
  • 亚马逊AWS发布论文探讨了基于扩散的文本到图像生成(Text-to-Image, T2I)模型的可扩展性。扩散模型是一种通过逐步去噪来生成图像的深度学习技术。论文的主要目的是理解如何有效地扩展这些模型以提高性能,同时降低成本。 主要功能和特点: 模型和数据集的扩展性研究:论文通过大量实验研究了扩展模型和数据集对性能的影... 阅读全文

    优惠 潜在扩散模型扩展特性研究

  • 潜在扩散模型扩展特性研究
    AI
  • 来自谷歌和约翰霍普金斯大学的研究人员探讨了潜在扩散模型(Latent Diffusion Models,简称LDMs)的扩展特性,特别关注了它们在采样效率方面的表现。潜在扩散模型是一种用于生成图像的深度学习模型,可以通过文本描述来创建高质量的图像。尽管这类模型在图像合成、视频制作、音频生成等领域表现出色,但它们的一个主... 阅读全文

    优惠 一个可以在在Discord bot上使用Copilot和Bing Image Creator、DALLE-3的开源项目DiscordBot-EdgeGPT

  • 一个可以在在Discord bot上使用Copilot和Bing Image Creator、DALLE-3的开源项目DiscordBot-EdgeGPT
    AI
  • DiscordBot-EdgeGPT是一个可以在在Discord bot上使用Copilot和Bing Image Creator、DALLE-3的开源项目。... 阅读全文

    优惠 Zigzag Mamba:解决现有扩散模型在处理视觉数据时的可扩展性和计算复杂性问题

  • Zigzag Mamba:解决现有扩散模型在处理视觉数据时的可扩展性和计算复杂性问题
    AI
  • 慕尼黑大学的研究团队发布论文介绍了一种名为Zigzag Mamba(ZigMa)的新型扩散模型,它是为了解决现有扩散模型在处理视觉数据时的可扩展性和计算复杂性问题。扩散模型是一种深度学习技术,用于生成图像、视频等内容,但它们在处理大规模数据时面临挑战。总的来说,ZigMa是一种新型的扩散模型,它通过改进数据处理方式和优... 阅读全文

    优惠 在线图片编辑工具Fotor:删除背景、生成照片、模糊图像等

  • 在线图片编辑工具Fotor:删除背景、生成照片、模糊图像等
    AI
  • Fotor是一个在线图片编辑工具,提供了强大的图像处理工具,让您轻松完成各种图片编辑需求,官方近期推出了AI 照片编辑工具箱:删除背景、生成照片、模糊图像等等!以您想要的任何方式设计和编辑照片,就像呼吸一样简单,而且全部免费!... 阅读全文

    优惠 支持多语言提示词的AI绘画应用Musavir.AI

  • 支持多语言提示词的AI绘画应用Musavir.AI
    AI
  • Musavir.AI是一款在线的AI绘画应用,支持多语言提示词,包括中文,可惜的是付费才可以使用,免费用户没有免费额度。... 阅读全文