推荐类别

栏目分类

优惠 基于Stable Diffusion的在线AI绘画网站Gencraft

  • 基于Stable Diffusion的在线AI绘画网站Gencraft
    AI
  • Gencraft是一个基于Stable Diffusion的在线AI绘画网站,可注册也可使用谷歌账号登录,免费用户每天有5张免费额度,可以生成1024x1024解析度的图片,大家可以试试。 ...... 阅读全文

    优惠 3DGStream:用于实时流式传输真实感自由视角视频

  • 3DGStream:用于实时流式传输真实感自由视角视频
    AI
  • 来自浙江大学的研究人员发布论文介绍了一个名为3DGStream的方法,它是一种用于实时流式传输真实感自由视角视频(Free-Viewpoint Videos, FVVs)的技术。这种方法特别适用于动态场景,比如人们在房间内移动或者物体在 ...... 阅读全文

    优惠 Google DeepMind推出机器人学习框架RT-H:通过自然语言来构建动作层级结构,以便更有效地学习和执行复杂的任务

  • Google DeepMind推出机器人学习框架RT-H:通过自然语言来构建动作层级结构,以便更有效地学习和执行复杂的任务
    AI
  • Google DeepMind推出机器人学习框架RT-H(Robot Transformer with Action Hierarchies)的机器人学习框架。RT-H的目标是通过自然语言来构建动作层级结构,以便更有效地学习和执行复杂的任务。这个框架利用了语言的表 ...... 阅读全文

    优惠 新型网络架构DenseMamba:针对大语言模型的一种高效状态空间模型

  • 新型网络架构DenseMamba:针对大语言模型的一种高效状态空间模型
    AI
  • 这篇论文介绍了一个名为DenseMamba的新型网络架构,它是针对大语言模型(LLMs)的一种高效状态空间模型(SSM)。大型语言模型,如GPT-3和BERT,通常依赖于Transformer架构,这种架构在处理长文本时计算和内存需求非 ...... 阅读全文

    百科 微软和谷歌的大神教你如何写提示词!

  • 微软和谷歌的大神教你如何写提示词!
  • 来自斯坦福大学、佐治亚理工学院、微软和谷歌DeepMind的研究人员推出了一个Design2Code项目,它探讨多模态大语言模型在前端开发中的应用。简单来说就是利用多模态大语言模型(如 GPT-4V )直接将设计草图自动生成相 ...... 阅读全文

    优惠 Design2Code:多模态大语言模型在前端开发中的应用

  • Design2Code:多模态大语言模型在前端开发中的应用
    AI
  • 来自斯坦福大学、佐治亚理工学院、微软和谷歌DeepMind的研究人员推出Design2Code项目,它探索了多模态大语言模型(LLM)在前端开发中的应用。这项任务的目标是将视觉设计直接转化为代码实现,从而改变了前端开发的工 ...... 阅读全文

    优惠 新型推荐系统架构Wukong:解决现有推荐模型在处理大规模数据集时的效率和质量问题

  • 新型推荐系统架构Wukong:解决现有推荐模型在处理大规模数据集时的效率和质量问题
    AI
  • 这篇论文介绍了一个名为Wukong的新型推荐系统架构。Wukong的目标是解决现有推荐模型在处理大规模数据集时的效率和质量问题。在推荐系统中,我们通常希望模型能够理解用户的行为和偏好,从而推荐用户可能感兴趣的内容 ...... 阅读全文

    优惠 量化方法EasyQuant:减小模型大小和计算成本的技术,使模型能够在资源有限的设备上运行

  • 量化方法EasyQuant:减小模型大小和计算成本的技术,使模型能够在资源有限的设备上运行
    AI
  • 腾讯发布论文探讨关于大型语言模型(LLMs)的量化方法,特别是针对那些拥有数十亿甚至更多参数的模型。简单来说,模型量化是一种减小模型大小和计算成本的技术,使模型能够在资源有限的设备上运行,例如手机或嵌入式 ...... 阅读全文

    优惠 MathScale:提高大语言模型在解决数学问题方面的能力

  • MathScale:提高大语言模型在解决数学问题方面的能力
    AI
  • 来自香港中文大学、微软亚洲研究院、深圳研究院 大数据研究所的研究人员推出MathScale,它旨在提高大语言模型(LLMs)在解决数学问题方面的能力。尽管LLMs在解决问题方面表现出色,但在处理数学问题时仍然存在不足。 ...... 阅读全文

    优惠 经过改进的多模态大语言模型LLaVA-HR:专门设计来处理高分辨率图像,以提高在视觉和语言任务上的性能

  • 经过改进的多模态大语言模型LLaVA-HR:专门设计来处理高分辨率图像,以提高在视觉和语言任务上的性能
    AI
  • LLaVA-HR(LLaVA High-Resolution)是一个经过改进的多模态大语言模型(MLLM),它专门设计来处理高分辨率图像,以提高在视觉和语言任务上的性能。这个模型是基于LLaVA-1.5的架构,通过引入Mixture-of-Resolution Ad ...... 阅读全文

    优惠 自动化流程框架MAGID:生成合成的多模态(文本和图像)对话数据集

  • 自动化流程框架MAGID:生成合成的多模态(文本和图像)对话数据集
    AI
  • 来自滑铁卢大学和亚马逊AWS人工智能实验室的研究人员推出MAGID(Multimodal Augmented Generative Images Dialogues)框架,它是一个自动化流程,用于生成合成的多模态(文本和图像)对话数据集。这个框架的目的是为 ...... 阅读全文

    优惠 文本到语音(TTS)合成系统NaturalSpeech 3:生成自然、高质量且具有零样本(zero-shot)能力的语音

  • 文本到语音(TTS)合成系统NaturalSpeech 3:生成自然、高质量且具有零样本(zero-shot)能力的语音
    AI
  • 来自微软亚洲研究院、中国科学技术大学、香港中文大学(深圳)、浙江大学、东京大学、北京大学的研究人员推出文本到语音(TTS)合成系统NaturalSpeech 3。这个系统的目标是生成自然、高质量且具有零样本(zero-shot ...... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?