首页
情报
装备
百科
精选
快讯
AI
猫咪范
首页
情报
装备
百科
精选
快讯
AI
猫咪范
注册
登录
推荐类别
栏目分类
开源软件
>
在线工具
开源软件
电脑软件
人工智能
>
3D
AI绘画
AI编程
AI视频
AI音频
ChatGPT
大语言模型
数字人
机器人
电脑游戏
>
chinaplay.store
Discord
Epic Games
Fanatical
GameSessions
giveaway
GMG
GOG
HumbleBundle
indiegala
IO游戏
itch.io
Microsoft Store
Origin
Rockstar Games Launcher
STEAM
Uplay
Wegame
Windows
战网
方块游戏
杉果游戏
主机游戏
>
任天堂Switch
微软Xbox
索尼PlayStation
手机游戏
>
IOS
taptap
安卓
优惠
多模态框架VisionGPT-3D:提升三维视觉理解的能力
AI
推荐人:暴走AI
标签:
VisionGPT-3D
多模态
AI
1年前 (2024-03-15)AI
多模态框架VisionGPT-3D,它旨在提升三维视觉理解的能力。VisionGPT-3D通过整合现有的最佳视觉模型,自动化选择适合的算法,从而将二维图像转换为三维表示,这在计算机视觉领域是一个创新的尝试。 主要功能和特点: 多模态整合: VisionGPT-3D结合了文本和视觉信息,能够理解和处理图像中的内容,并根据...
阅读全文
直达链接
好
0
不好
0
0
多模态框架VisionGPT-3D:提升三维视觉理解的能力
已关闭评论
优惠
Hugging Face推出数据集WebSight和基于视觉-语言模型的系统Sightseer:它们旨在自动化网页截图到HTML代码的转换过程
AI
推荐人:暴走AI
标签:
Hugging Face
Sightseer
WebSight
AI
1年前 (2024-03-15)AI
Hugging Face推出数据集WebSight和一个基于视觉-语言模型(VLM)的系统Sightseer,它们旨在自动化网页截图到HTML代码的转换过程。这项技术对于网页开发者来说非常有价值,因为它可以极大地提高开发效率,尤其是在无代码(no-code)解决方案中。 主要功能和特点: WebSight数据集: 包含...
阅读全文
直达链接
好
0
不好
0
0
Hugging Face推出数据集WebSight和基于视觉-语言模型的系统Sightseer:它们旨在自动化网页截图到HTML代码的转换过程
已关闭评论
优惠
视觉状态空间模型LocalMamba:为了提高计算机视觉任务的性能而设计
AI
推荐人:暴走AI
标签:
LocalMamba
视觉状态空间模型
AI
1年前 (2024-03-15)AI
来自悉尼大学工程学院计算机科学学院、商汤科技研究院、中国科学技术大学的研究团队推出视觉状态空间模型(Visual State Space Model)LocalMamba,它是为了提高计算机视觉任务的性能而设计的。LocalMamba的核心思想是通过优化扫描方向来更好地捕捉图像中的局部依赖关系,同时保持全局上下文的理解...
阅读全文
直达链接
好
0
不好
0
0
视觉状态空间模型LocalMamba:为了提高计算机视觉任务的性能而设计
已关闭评论
优惠
基于新型的架构状态空间模型(SSM)开发的视频理解工具套件Video Mamba Suite
AI
推荐人:暴走AI
标签:
Video Mamba Suite
视频理解工具
AI
1年前 (2024-03-15)AI
来自南京大学、上海人工智能实验室OpenGVLab、复旦大学和浙江大学推出视频理解工具套件Video Mamba Suite,它是基于一种新型的架构——状态空间模型(State Space Model,简称SSM)开发的。这个套件旨在提高计算机对视频内容的理解能力,类似于我们人类观看和解释视频的方式。 主要功能和特点:...
阅读全文
直达链接
好
0
不好
0
0
基于新型的架构状态空间模型(SSM)开发的视频理解工具套件Video Mamba Suite
已关闭评论
优惠
SuperAGI推出新型多模态模型Veagle:如何将语言和视觉信息结合起来,以便更好地理解和处理包含文本的图像
AI
推荐人:暴走AI
标签:
Veagle
多模态模型
AI
1年前 (2024-03-15)
SuperAGI推出新型多模态模型Veagle,它专注于如何将语言和视觉信息结合起来,以便更好地理解和处理包含文本的图像。在现实世界中,我们经常遇到包含文本的图像,比如路标、菜单或者商品包装,理解和解释这些图像中的文本对于人工智能来说是一个挑战。 GitHub:https://github.com/superagi/V...
阅读全文
好
0
不好
0
0
SuperAGI推出新型多模态模型Veagle:如何将语言和视觉信息结合起来,以便更好地理解和处理包含文本的图像
已关闭评论
优惠
新型高分辨率多模态感知模型Griffon v2:在提高大型视觉语言模型(LVLMs)在处理高分辨率图像时的性能,特别是在复杂和密集场景中对细粒度对象的识别和定位
AI
推荐人:暴走AI
标签:
Griffon v2
AI
1年前 (2024-03-15)AI
来自中国科学院自动化研究所基础模型研究中心、中国科学院大学人工智能学院、鹏城实验室和武汉人工智能研究院的研究团队推出新型高分辨率多模态感知模型Griffon v2,这个模型旨在提高大型视觉语言模型(LVLMs)在处理高分辨率图像时的性能,特别是在复杂和密集场景中对细粒度对象的识别和定位。Griffon v2通过视觉和文...
阅读全文
直达链接
好
0
不好
0
0
新型高分辨率多模态感知模型Griffon v2:在提高大型视觉语言模型(LVLMs)在处理高分辨率图像时的性能,特别是在复杂和密集场景中对细粒度对象的识别和定位
已关闭评论
优惠
新型分布式注意力框架BurstAttention:专门设计来处理极长序列的数据
AI
推荐人:暴走AI
标签:
BurstAttention
AI
1年前 (2024-03-15)AI
这篇论文介绍了一个名为BurstAttention的新型分布式注意力框架,它专门设计来处理极长序列的数据。在大语言模型(LLMs)中,注意力模块是理解复杂文本和生成响应的关键部分,但是随着序列长度的增加,这些模块在计算时间和内存消耗上的复杂度也会呈二次方增长,这就成了一个挑战。BurstAttention通过在多个设备...
阅读全文
直达链接
好
0
不好
0
0
新型分布式注意力框架BurstAttention:专门设计来处理极长序列的数据
已关闭评论
优惠
新型视觉模型GiT:通过一个通用的语言接口来处理各种视觉任务,从而实现一个视觉领域的通用模型
AI
推荐人:暴走AI
标签:
GiT
视觉模型
AI
1年前 (2024-03-15)AI
来自北京大学、马克斯·普朗克信息学研究所、香港中文大学(深圳)、苏黎世联邦理工学院、香港中文大学的研究团队推出新型视觉模型GiT(Generalist Vision Transformer),它的目标是通过一个通用的语言接口来处理各种视觉任务,从而实现一个视觉领域的通用模型。想象一下,有一个智能助手,它可以看一张图片,...
阅读全文
直达链接
好
0
不好
0
0
新型视觉模型GiT:通过一个通用的语言接口来处理各种视觉任务,从而实现一个视觉领域的通用模型
已关闭评论
优惠
在线转录工具oTranscribe,帮您摆脱听写录音稿的痛苦!
工具
推荐人:暴走AI
标签:
oTranscribe
录音稿
工具
1年前 (2024-03-15)工具
oTranscribe 由《华尔街日报》数据记者 Elliot Bentley 开发的在线转录平台,所有代码都是开源的,转写时只是会从本地读取录音文件,不会将你的录音文件上传到云端,在满足记者使用习惯的同时,又充分保护了数据隐私。...
阅读全文
直达链接
好
0
不好
0
0
在线转录工具oTranscribe,帮您摆脱听写录音稿的痛苦!
已关闭评论
优惠
新型语言模型Quiet-STaR:能够自己“思考”以提高对文本的理解能力
AI
推荐人:暴走AI
标签:
Quiet-STaR
AI
1年前 (2024-03-15)AI
来自斯坦福大学和Notbad AI的研究团队推出新型语言模型Quiet-STaR(Quiet Self-Taught Reasoner),它能够自己“思考”以提高对文本的理解能力。想象一下,当你在写作或说话时,有时会停下来思考一下,这是因为我们在大脑中构建了一种逻辑或推理过程,帮助我们更好地表达或解决问题。Quiet-...
阅读全文
直达链接
好
0
不好
0
0
新型语言模型Quiet-STaR:能够自己“思考”以提高对文本的理解能力
已关闭评论
优惠
新型人工智能模型3D-VLA:能够理解三维视觉信息、语言指令,并在此基础上进行行动规划的生成式世界模型
AI
推荐人:暴走AI
标签:
3D-VLA
AI
1年前 (2024-03-15)AI
来自马萨诸塞大学阿默斯特分校、上海交通大学、华南理工大学、武汉大学、麻省理工学院和IBM Watson AI 实验室的研究团队推出新型人工智能模型3D-VLA(3D Vision-Language-Action),它是一个能够理解三维视觉信息、语言指令,并在此基础上进行行动规划的生成式世界模型。想象一下,你有一个机器人...
阅读全文
直达链接
好
1
不好
0
0
新型人工智能模型3D-VLA:能够理解三维视觉信息、语言指令,并在此基础上进行行动规划的生成式世界模型
已关闭评论
优惠
一款强大的网站分析工具Web-Check,助力网站管理与安全新境界
工具
推荐人:暴走AI
标签:
Web-Check
工具
1年前 (2024-03-15)工具
Web-Check是一款集多种检测功能于一体的网站分析工具,专为网站管理者设计,旨在通过公开来源情报(OSINT)深入剖析网站的内部工作原理,进而优化网站性能、提升安全性,并有效防范潜在威胁和恶意攻击。这款工具通过整合丰富的检测项目,为管理者提供了一个便捷、高效的解决方案。 Web-Check支持的检测项目相当丰富,涵...
阅读全文
直达链接
好
0
不好
0
0
一款强大的网站分析工具Web-Check,助力网站管理与安全新境界
已关闭评论
共 606 页
« 第一页
...
«
139
140
141
142
»
...
最后 »
微信二维码
热门
杉果春节特惠第二日:各种传家宝,还有育碧全线游戏新史低!
(689℃)
《塞尔达无双:灾厄启示录》正式发售,深入了解《旷野之息》百年前的大灾厄事件
(995℃)
2D动作冒险游戏《莱娜的奠基》正式发售,可选择 8-bit 或 32 Bit 画面风格展开冒险
(757℃)
了解下殡葬师的故事!模拟游戏《殡葬师的故事》开启限免
(1163℃)
享受西部牛仔生活!模拟游戏《牛仔生活模拟》免费体验版上架Steam
(529℃)
《黑道圣徒》系列和《混乱特工》开启联合促销,多款游戏平史低
(564℃)
我要爆料
我的收藏
顶部
快速登录
账户:
密码:
验证码:7 + 8 =
自动登录
忘记密码?
QQ登录
微博登录
注 册