首页
情报
装备
百科
精选
快讯
AI
猫咪范
首页
情报
装备
百科
精选
快讯
AI
猫咪范
注册
登录
推荐类别
栏目分类
开源软件
>
在线工具
开源软件
电脑软件
人工智能
>
3D
AI绘画
AI编程
AI视频
AI音频
ChatGPT
大语言模型
数字人
机器人
电脑游戏
>
chinaplay.store
Discord
Epic Games
Fanatical
GameSessions
giveaway
GMG
GOG
HumbleBundle
indiegala
IO游戏
itch.io
Microsoft Store
Origin
Rockstar Games Launcher
STEAM
Uplay
Wegame
Windows
战网
方块游戏
杉果游戏
主机游戏
>
任天堂Switch
微软Xbox
索尼PlayStation
手机游戏
>
IOS
taptap
安卓
优惠
轻量级视觉模型EfficientVMamba:结合了全局和局部特征提取能力的网络架构
AI
推荐人:暴走AI
标签:
EfficientVMamba
AI
2年前 (2024-03-21)AI
来自悉尼大学的研究团队论文介绍了一种名为EfficientVMamba的轻量级视觉模型,它是一种结合了全局和局部特征提取能力的网络架构。想象一下,你有一个超级助手,它能够在保持图像细节的同时,快速地从大量图片中识别出不同的物体。EfficientVMamba就像这样一个助手,但它专注于图像处理和识别任务。 主要功能和特...
阅读全文
直达链接
好
0
不好
0
0
轻量级视觉模型EfficientVMamba:结合了全局和局部特征提取能力的网络架构
已关闭评论
优惠
新型光学流估计架构NeuFlow:在机器人和其他边缘设备上实时、高精度估计图像中物体运动的技术
AI
推荐人:暴走AI
标签:
NeuFlow
AI
2年前 (2024-03-20)AI
这篇论文介绍了一种名为NeuFlow的新型光学流估计架构,这是一种在机器人和其他边缘设备上实时、高精度估计图像中物体运动的技术。光学流估计在计算机视觉领域扮演着重要角色,它帮助我们理解图像中物体是如何移动的,这对于机器人定位、地图构建、物体追踪和活动识别等应用至关重要。 主要功能: NeuFlow的主要功能是提供一种既...
阅读全文
直达链接
好
0
不好
0
0
新型光学流估计架构NeuFlow:在机器人和其他边缘设备上实时、高精度估计图像中物体运动的技术
已关闭评论
优惠
创新模型Uni-SMART:万能的科学多模态分析和研究转换器,专门设计用于深入理解科学文献中的多模态内容
AI
推荐人:暴走AI
AI
2年前 (2024-03-20)AI
这篇论文介绍了一个名为Uni-SMART的创新模型,它是一个万能的科学多模态分析和研究转换器,专门设计用于深入理解科学文献中的多模态内容。随着科学知识的快速增长,学术论文的数量急剧增加,这使得深入分析文献变得既耗时又具有挑战性。Uni-SMART通过结合大型语言模型(LLMs)的强大文本总结能力和对多模态元素(如分子结...
阅读全文
直达链接
好
0
不好
0
0
创新模型Uni-SMART:万能的科学多模态分析和研究转换器,专门设计用于深入理解科学文献中的多模态内容
已关闭评论
优惠
VideoAgent:模仿人类理解长视频的认知过程,使用大语言模型作为中心代理,来迭代地识别和编译关键信息以回答问题
AI
推荐人:暴走AI
标签:
VideoAgent
AI
2年前 (2024-03-20)AI
这篇论文介绍了一个名为VideoAgent的系统,它模仿人类理解长视频的认知过程,使用大型语言模型(LLM)作为中心代理,来迭代地识别和编译关键信息以回答问题。VideoAgent将视频理解过程视为一系列状态、动作和观察的序列,并通过与视觉语言模型(VLM)和对比语言-图像模型(CLIP)的交互来获取和处理视觉信息。 ...
阅读全文
直达链接
好
0
不好
0
0
VideoAgent:模仿人类理解长视频的认知过程,使用大语言模型作为中心代理,来迭代地识别和编译关键信息以回答问题
已关闭评论
优惠
多模态智能代理VideoAgent:为了更好地理解和解释视频内容而设计
AI
推荐人:暴走AI
标签:
VideoAgent
AI
2年前 (2024-03-20)AI
这篇论文介绍了一个名为VideoAgent的多模态智能代理,它是为了更好地理解和解释视频内容而设计的。想象一下,你有一个视频,里面有很多人和物体在移动,还有很多事情发生。VideoAgent就像一个超级助手,能够理解视频中的内容,并回答关于视频的问题。 主要功能: VideoAgent的主要功能是视频理解。它可以分析视...
阅读全文
直达链接
好
0
不好
0
0
多模态智能代理VideoAgent:为了更好地理解和解释视频内容而设计
已关闭评论
优惠
新型模型MindEye2:能够从大脑活动(fMRI)中重建出人们所看到的视觉图像
AI
推荐人:暴走AI
标签:
MindEye2
AI
2年前 (2024-03-20)AI
这篇论文介绍了一个名为MindEye2的新型模型,它能够从大脑活动(fMRI)中重建出人们所看到的视觉图像。这个模型的出现,标志着我们离理解人类视觉感知的神经基础又近了一步。MindEye2的创新之处在于,它能够使用仅有1小时的fMRI训练数据,就能产生高质量的图像重建结果。例如,如果我们想要了解一个观看自然风景图片的...
阅读全文
直达链接
好
0
不好
0
0
新型模型MindEye2:能够从大脑活动(fMRI)中重建出人们所看到的视觉图像
已关闭评论
优惠
大型多模态模型LLaVA-UHD:能够高效地处理任意宽高比和高分辨率的图像
AI
推荐人:暴走AI
标签:
LLaVA-UHD
多模态模型
AI
2年前 (2024-03-20)AI
来自清华大学、新加坡国立大学和中国科学院大学推出大型多模态模型LLaVA-UHD,它能够高效地处理任意宽高比和高分辨率的图像。在现实世界中,图像的宽高比和分辨率多种多样,这对于大型多模态模型(LMMs)在理解和处理视觉信息时提出了挑战。现有的LMMs通常只能处理固定宽高比和低分辨率的图像,这会导致图像内容的严重形变和模...
阅读全文
直达链接
好
0
不好
0
0
大型多模态模型LLaVA-UHD:能够高效地处理任意宽高比和高分辨率的图像
已关闭评论
优惠
IBM推出新型大语言模型Larimar:通过引入一个分布式的情节记忆系统来增强LLM的能力
AI
推荐人:暴走AI
标签:
IBM
Larimar
AI
2年前 (2024-03-20)AI
IBM推出新型大语言模型Larimar,它通过引入一个分布式的情节记忆系统来增强LLM的能力。Larimar的记忆系统允许动态、一次性地更新知识,而不需要进行计算成本高昂的重新训练或微调。例如,如果我们有一个提供天气预报的AI助手,当一个新的风暴形成时,我们希望能够快速更新模型的天气预报数据。使用Larimar,我们可...
阅读全文
直达链接
好
0
不好
0
0
IBM推出新型大语言模型Larimar:通过引入一个分布式的情节记忆系统来增强LLM的能力
已关闭评论
优惠
谷歌发布“参数高效强化学习(PERL)”:通过人类反馈来高效地训练大语言模型,使其更好地符合人类的偏好
AI
推荐人:暴走AI
标签:
PERL
参数高效强化学习
AI
2年前 (2024-03-20)AI
谷歌发布论文的主题是如何通过人类反馈来高效地训练大语言模型(LLMs),使其更好地符合人类的偏好。具体来说,研究者们提出了一种名为“参数高效强化学习”(Parameter Efficient Reinforcement Learning,简称PERL)的方法,该方法结合了低秩适应(Low-Rank Adaptation...
阅读全文
直达链接
好
0
不好
0
0
谷歌发布“参数高效强化学习(PERL)”:通过人类反馈来高效地训练大语言模型,使其更好地符合人类的偏好
已关闭评论
优惠
Gorilla:连接海量 API 的大语言模型
AI
推荐人:暴走AI
标签:
Gorilla
AI
2年前 (2024-03-20)AI
加州大学伯克利分校发布论文的主题是关于如何将大语言模型(Large Language Models,简称LLMs)适应于特定领域的检索增强生成(Retrieval Augmented Generation,简称RAG)任务。简单来说,就是研究如何让AI模型在处理特定领域的问题时,能够更准确地利用相关文档来提供答案。例如...
阅读全文
直达链接
好
0
不好
0
0
Gorilla:连接海量 API 的大语言模型
已关闭评论
优惠
谷歌推出新型机器学习架构和训练方法DiPaCo
AI
推荐人:暴走AI
标签:
DiPaCo
AI
2年前 (2024-03-20)AI
谷歌发布论文介绍了一个名为DiPaCo(Distributed Path Composition)的新型机器学习架构和训练方法。DiPaCo的核心思想是将大型神经网络模型分解为多个模块,这些模块可以通过路径进行分布式计算。这种方法的目的是减少在训练过程中所需的通信量,从而使得在资源有限或连接不良的计算环境中也能有效地训...
阅读全文
直达链接
好
0
不好
0
0
谷歌推出新型机器学习架构和训练方法DiPaCo
已关闭评论
优惠
Google Research发布论文介绍了一种新技术,旨在提升视觉-语言模型(VLMs)的推理能力
AI
推荐人:暴走AI
标签:
谷歌
AI
2年前 (2024-03-20)AI
Google Research发布论文介绍了一种新技术,旨在提升视觉-语言模型(VLMs)的推理能力。VLMs是一种人工智能模型,它能够理解和处理包含图像和文本的信息,例如图表、图形和图解。尽管VLMs在多模态任务上的表现越来越强,但它们的推理能力仍然有限,尤其是相对于大型语言模型(LLMs)而言。 主要功能和特点: ...
阅读全文
直达链接
好
0
不好
0
0
Google Research发布论文介绍了一种新技术,旨在提升视觉-语言模型(VLMs)的推理能力
已关闭评论
共 1,704 页
« 第一页
...
«
328
329
330
331
»
...
最后 »
热门
育碧开放世界动作冒险游戏《渡神纪》2020年2月全球发售,画面风格与《塞尔达传说:旷野之息》相似
(1440℃)
恐怖冒险游戏《SUBWAY MIDNIGHT》Switch版发售,体验阴森又可爱、嘻哈又黑暗的独特风格
(921℃)
上帝视角砍杀ARPG《泠:落日孤行》登录PS4平台,踏上一段寻找自我的旅程
(1197℃)
越南独立工作室打造恐怖游戏《The Death | Thần Trùng》上架Steam
(627℃)
Steam平台限时免费领取《星际小队:传奇版》,Runner Duck团队又有新作了
(484℃)
备受好评的益智冒险游戏《点亮之路》,横跨整个星球来冒险
(1187℃)
我要爆料
我的收藏
顶部
快速登录
账户:
密码:
验证码:6 + 8 =
自动登录
忘记密码?
QQ登录
微博登录
注 册