数据集

优惠 文本到视频提示词数据集VidProM

  • 文本到视频提示词数据集VidProM
    AI
  • 来自悉尼科技大学和浙江大学的研究人员推出大规模真实用户文本到视频提示数据集VidProM。VidProM是一个强大的资源,它不仅为视频内容创作者提供了丰富的素材,也为研究人员提供了一个宝贵的工具,用于推动文本到视频生成技术的发展。 GitHub:https://github.com/WangWenhao0716/Vid... 阅读全文

    优惠 自动化流程框架MAGID:生成合成的多模态(文本和图像)对话数据集

  • 自动化流程框架MAGID:生成合成的多模态(文本和图像)对话数据集
    AI
  • 来自滑铁卢大学和亚马逊AWS人工智能实验室的研究人员推出MAGID(Multimodal Augmented Generative Images Dialogues)框架,它是一个自动化流程,用于生成合成的多模态(文本和图像)对话数据集。这个框架的目的是为了解决在开发多模态交互系统时,缺乏丰富、多模态(文本、图像)对话... 阅读全文

    优惠 学术干货 | 大语言模型数据集大盘点

  • 学术干货 | 大语言模型数据集大盘点
    AI
  • 华南理工与合合信息团队联合发布了一篇深度解析论文,聚焦大语言模型(LLM)所需的数据集现状与发展趋势。他们从五大关键方面梳理了LLM数据集资源: 1️⃣ 预训练语料库:奠定LLM语言学习基础的大规模文本集合。 2️⃣ 指令微调数据集:专门针对LLM进行任务导向性优化的关键数据源。 3️⃣ 偏好数据集:关乎用户需求、道德... 阅读全文

    优惠 Meta推出多模态开放数据集AEA,通过Project Aria眼镜收集

  • Meta推出多模态开放数据集AEA,通过Project Aria眼镜收集
    AI
  • Meta推出数据集Aria Everyday Activities (AEA) ,这是一个以第一人称视角记录的多模态开放数据集,通过Project Aria眼镜收集。AEA数据集包含了多个佩戴者在五个不同地理位置的室内环境中记录的143个日常活动序列。每个记录都包含了通过Project Aria眼镜收集的多模态传感器数... 阅读全文