首页
情报
装备
百科
精选
快讯
AI
猫咪范
首页
情报
装备
百科
精选
快讯
AI
猫咪范
注册
登录
推荐类别
栏目分类
开源软件
>
在线工具
开源软件
电脑软件
人工智能
>
3D
AI绘画
AI编程
AI视频
AI音频
ChatGPT
大语言模型
数字人
机器人
电脑游戏
>
chinaplay.store
Discord
Epic Games
Fanatical
GameSessions
giveaway
GMG
GOG
HumbleBundle
indiegala
IO游戏
itch.io
Microsoft Store
Origin
Rockstar Games Launcher
STEAM
Uplay
Wegame
Windows
战网
方块游戏
杉果游戏
主机游戏
>
任天堂Switch
微软Xbox
索尼PlayStation
手机游戏
>
IOS
taptap
安卓
多模态数据集
优惠
大规模多模态数据集OmniCorpus:包含了十亿级别的图像和文本数据
AI
推荐人:暴走AI
标签:
OmniCorpus
多模态数据集
AI
2年前 (2024-06-17)AI
上海人工智能实验室、哈尔滨工业大学、南京大学、复旦大学、香港中文大学、商汤科技研究院和清华大学的研究团队推出大规模多模态数据集OmniCorpus,它包含了十亿级别的图像和文本数据,这些数据以自然文档的格式排列,模仿了互联网数据的呈现方式,也符合人类的阅读习惯。这个数据集的建立旨在推动多模态大型语言模型(MLLMs)的...
阅读全文
直达链接
好
0
不好
0
0
大规模多模态数据集OmniCorpus:包含了十亿级别的图像和文本数据
已关闭评论
优惠
结合触觉、视觉和语言的多模态数据集TVL:用于训练和评估能够理解和生成触觉感受描述的模型
AI
推荐人:暴走AI
标签:
Touch-Vision-Language
TVL
多模态数据集
AI
2年前 (2024-02-21)AI
加州大学伯克利分校、Meta AI和德累斯顿工业大学的研究人员推出一个关于创建一个结合触觉、视觉和语言的多模态数据集,用于训练和评估能够理解和生成触觉感受描述的模型。这个数据集名为Touch-Vision-Language (TVL),它包含了44,000对视觉-触觉观察数据,其中10%由人类标注,90%由GPT-4V...
阅读全文
直达链接
好
0
不好
0
0
结合触觉、视觉和语言的多模态数据集TVL:用于训练和评估能够理解和生成触觉感受描述的模型
已关闭评论
热门
开源Chrome 插件「Little Rat」,监测第三方 Chrome插件联网情况,可阻断扩展网络连接
(930℃)
大语言模型在小学数学问题上的表现
(587℃)
提高大语言模型(LLMs)在生成文本时的效率和速度
(516℃)
Zigzag Mamba:解决现有扩散模型在处理视觉数据时的可扩展性和计算复杂性问题
(750℃)
回合制策略游戏《人类》正式上线:打造专属自己的文明
(805℃)
支持离线下载的网盘Pikpak开启圣诞优惠,首开年费五折优惠
(758℃)
我要爆料
我的收藏
顶部
快速登录
账户:
密码:
验证码:8 + 5 =
自动登录
忘记密码?
QQ登录
微博登录
注 册