推荐类别

栏目分类

优惠 量化方法EasyQuant:减小模型大小和计算成本的技术,使模型能够在资源有限的设备上运行

  • 量化方法EasyQuant:减小模型大小和计算成本的技术,使模型能够在资源有限的设备上运行
    AI
  • 腾讯发布论文探讨关于大型语言模型(LLMs)的量化方法,特别是针对那些拥有数十亿甚至更多参数的模型。简单来说,模型量化是一种减小模型大小和计算成本的技术,使模型能够在资源有限的设备上运行,例如手机或嵌入式 ...... 阅读全文

    优惠 MathScale:提高大语言模型在解决数学问题方面的能力

  • MathScale:提高大语言模型在解决数学问题方面的能力
    AI
  • 来自香港中文大学、微软亚洲研究院、深圳研究院 大数据研究所的研究人员推出MathScale,它旨在提高大语言模型(LLMs)在解决数学问题方面的能力。尽管LLMs在解决问题方面表现出色,但在处理数学问题时仍然存在不足。 ...... 阅读全文

    优惠 经过改进的多模态大语言模型LLaVA-HR:专门设计来处理高分辨率图像,以提高在视觉和语言任务上的性能

  • 经过改进的多模态大语言模型LLaVA-HR:专门设计来处理高分辨率图像,以提高在视觉和语言任务上的性能
    AI
  • LLaVA-HR(LLaVA High-Resolution)是一个经过改进的多模态大语言模型(MLLM),它专门设计来处理高分辨率图像,以提高在视觉和语言任务上的性能。这个模型是基于LLaVA-1.5的架构,通过引入Mixture-of-Resolution Ad ...... 阅读全文

    优惠 自动化流程框架MAGID:生成合成的多模态(文本和图像)对话数据集

  • 自动化流程框架MAGID:生成合成的多模态(文本和图像)对话数据集
    AI
  • 来自滑铁卢大学和亚马逊AWS人工智能实验室的研究人员推出MAGID(Multimodal Augmented Generative Images Dialogues)框架,它是一个自动化流程,用于生成合成的多模态(文本和图像)对话数据集。这个框架的目的是为 ...... 阅读全文

    优惠 文本到语音(TTS)合成系统NaturalSpeech 3:生成自然、高质量且具有零样本(zero-shot)能力的语音

  • 文本到语音(TTS)合成系统NaturalSpeech 3:生成自然、高质量且具有零样本(zero-shot)能力的语音
    AI
  • 来自微软亚洲研究院、中国科学技术大学、香港中文大学(深圳)、浙江大学、东京大学、北京大学的研究人员推出文本到语音(TTS)合成系统NaturalSpeech 3。这个系统的目标是生成自然、高质量且具有零样本(zero-shot ...... 阅读全文

    优惠 新型3D建模工具MagicClay:结合了Neural Fields和Meshes的混合表示方法,允许用户通过文本提示来雕塑和编辑3D模型

  • 新型3D建模工具MagicClay:结合了Neural Fields和Meshes的混合表示方法,允许用户通过文本提示来雕塑和编辑3D模型
    AI
  • 特拉维夫大学、Adobe 研究中心、加拿大蒙特利尔大学的研究人员推出新型3D建模工具MagicClay,它结合了神经场(Neural Fields)和三角网格(Meshes)的混合表示方法,允许用户通过文本提示来雕塑和编辑3D模型。这种方 ...... 阅读全文

    优惠 RT-Sketch系统:让机器人理解用户手绘的草图,并根据这些草图来执行动作

  • RT-Sketch系统:让机器人理解用户手绘的草图,并根据这些草图来执行动作
    AI
  • 斯坦福大学和谷歌的研究人员推出RT-Sketch系统,它是一个目标条件化的模仿学习(Imitation Learning, IL)策略,用于机器人操控任务。RT-Sketch的核心特点是它能够理解用户手绘的草图,并根据这些草图来执行动作。这 ...... 阅读全文

    优惠 Modeling Collaborator框架:通过自然语言交互来替代人工标注,大幅减少定义概念所需的工作量

  • Modeling Collaborator框架:通过自然语言交互来替代人工标注,大幅减少定义概念所需的工作量
    AI
  • 来自华盛顿大学和谷歌的研究人员推出Modeling Collaborator框架,它是一个创新的工具,旨在帮助人们以最小的努力训练视觉模型来识别复杂或主观的视觉概念。在日常生活中,我们经常需要计算机视觉系统来识别图片中的 ...... 阅读全文

    优惠 加州大学伯克利分校最新研究:机器人双手协同拧瓶盖

  • 加州大学伯克利分校最新研究:机器人双手协同拧瓶盖
    AI
  • 加州大学伯克利分校的研究人员发布论文,该主题是关于如何训练一个由两个多指机器人手组成的系统,使其能够旋转(拧开)各种类似瓶子物体的盖子。这个研究项目使用了深度强化学习(Deep Reinforcement Learning, DRL ...... 阅读全文

    优惠 MovieLLM框架:旨在通过GPT-4生成的电影相关的合成数据(包括剧本、关键帧图像等)来训练多模态大语言模型

  • MovieLLM框架:旨在通过GPT-4生成的电影相关的合成数据(包括剧本、关键帧图像等)来训练多模态大语言模型
    AI
  • 来自复旦大学和腾讯的研究人员推出MovieLLM框架,它旨在通过GPT-4生成的电影相关的合成数据(包括剧本、关键帧图像等)来训练多模态大型语言模型。这些模型经过训练后,能够更好地理解和处理长视频内容。简单来说,M ...... 阅读全文

    情报 中科院今年上半年发布自研 AI 大模型“紫东太初 3.0”,优化智能驾驶训练

  • 中科院今年上半年发布自研 AI 大模型“紫东太初 3.0”,优化智能驾驶训练
  • 近日,武汉人工智能研究院联合中国科学院自动化研究所宣布,自主研发的“紫东太初”大模型已迭代至2.0版本,并预计在今年上半年发布全新的3.0版本。这一创新性的技术进展,无疑将为人工智能领域带来更为深远的影响。 ...... 阅读全文

    情报 《黄金神威》电视剧版即将开播,演员阵容与制作团队与电影版相同

  • 《黄金神威》电视剧版即将开播,演员阵容与制作团队与电影版相同
  • 备受期待的真人版电影《黄金神威》的续作电视剧版正式宣布将于今年秋季开播。这部以野田サトル的漫画为原著改编的作品,继续以明治时代后期的北海道为舞台,展现了一场充满惊险与刺激的生存竞争。 电视剧版《黄金神 ...... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?