优惠 Adobe Research推出LogoMotion：基于大语言模型自动为静态布局生成动画

AI

推荐人：暴走AI 标签：Adobe LogoMotion AI

2年前 (2024-05-20)AI

Adobe Research推出LogoMotion，它是一个基于大语言模型（LLM）的方法，能够自动为静态布局生成动画。这个过程是内容感知的，意味着动画的生成会考虑到布局中的视觉内容和结构。LogoMotion通过两个阶段来实现：视觉 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠微软推出大型信息丰富的网络数据集MS MARCO Web Search

AI

推荐人：暴走AI 标签：MS MARCO Web Search 微软 AI

2年前 (2024-05-20)AI

微软推出大型信息丰富的网络数据集MS MARCO Web Search，它包含了数百万真实点击的查询-文档标签。这个数据集是首次尝试，旨在模拟现实世界中的网页文档和查询分布，为各种类型的下游任务提供丰富的信息，并鼓励在多 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Hugging Face推出具有8亿参数的视觉-语言模型Idefics2

AI

推荐人：暴走AI 标签：Idefics2 AI

2年前 (2024-05-20)AI

这篇论文的主题是关于构建视觉-语言模型（Vision-Language Models，简称VLMs）。这类模型结合了图像处理和自然语言处理的能力，能够理解图像内容并根据图像内容生成文字描述，或者根据文字描述找到相关的图像。论文 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠浙江大学和字节跳动的研究人员推出新颖框架Coin3D：用于生成可控且交互式的3D资产

AI

推荐人：暴走AI 标签：Coin3D 字节跳动浙江大学 AI

2年前 (2024-05-20)AI

浙江大学和字节跳动的研究人员推出新颖框架Coin3D，它用于生成可控且交互式的3D资产。Coin3D的核心思想是使用由基本形状（如球体、立方体、圆柱体等）组成的粗糙代理（proxy）来引导3D对象的生成，从而实现对生成过 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠亚马逊AWS推出新型大型多模态语言模型SpeechVerse：能够理解和执行自然语言指令，处理各种语音相关的任务

AI

推荐人：暴走AI 标签：SpeechVerse 多模态语言模型 AI

2年前 (2024-05-20)AI

亚马逊AWS推出新型大型多模态语言模型SpeechVerse，它能够理解和执行自然语言指令，处理各种语音相关的任务。SpeechVerse通过结合预训练的语音和文本基础模型，并在学习过程中保持这些模型的参数固定，实现了这一功 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 SpeechGuard：集成语音和大语言模型（SLMs）的安全性和鲁棒性

AI

推荐人：暴走AI 标签：SpeechGuard AI

2年前 (2024-05-20)AI

亚马逊AWS发布论文探讨集成语音和大语言模型（SLMs）的安全性和鲁棒性。SLMs是一类能够遵循语音指令并生成相关文本回答的AI系统，它们在最近变得越来越流行。然而，这些模型的安全防护和抵御恶意攻击的能力还不是很 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠在线（online）和离线（offline）对齐算法在人工智能（AI）领域中的表现差异

AI

推荐人：暴走AI 标签：对齐算法 AI

2年前 (2024-05-20)AI

谷歌发布论文探讨在线（online）和离线（offline）对齐算法在人工智能（AI）领域中的表现差异。对齐算法是帮助AI系统更好地符合人类意图和偏好的一类算法。想象一下，你正在教一个AI助手如何更好地理解你的需求，比 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Beyond Scaling Laws：探讨Transformer模型在语言处理任务中的表现，特别是它们在记忆训练样本时的性能动态

AI

推荐人：暴走AI 标签：Beyond Scaling Laws AI

2年前 (2024-05-20)AI

华为发布论文探讨Transformer模型在语言处理任务中的表现，特别是它们在记忆训练样本时的性能动态。论文提出了一个理论框架，用于解释基于Transformer的语言模型的记忆力过程和性能表现。研究的核心问题是，为什么增 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠华为诺亚方舟实验室推出轻量级视频理解网络SqueezeTime：专为移动设备上的视频理解任务设计

AI

推荐人：暴走AI 标签：SqueezeTime AI

2年前 (2024-05-20)AI

华为诺亚方舟实验室推出一种新型的轻量级视频理解网络SqueezeTime，专为移动设备上的视频理解任务设计。在移动设备上进行视频分析面临着计算能力和内存的严格限制，而传统的视频理解方法，如3D卷积网络，通常需要大 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠小多科技推出新型多模态视觉语言模型Xmodel-VLM

AI

推荐人：暴走AI 标签：Xmodel-VLM 小多科技 AI

2年前 (2024-05-20)AI

小多科技推出新型多模态视觉语言模型Xmodel-VLM，这个模型的主要目标是为了在消费级GPU服务器上高效部署，解决大规模多模态系统由于高昂的服务成本而难以广泛采用的关键行业问题。例如，我们有一个智能助手，它可以 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 ALPINE：调查Transformer模型是否能够通过自回归学习来执行规划任务，并识别其在规划能力方面的潜在限制

AI

推荐人：暴走AI 标签：ALPINE AI

2年前 (2024-05-20)AI

微软亚洲研究院发布论文，探讨在基于Transformer的语言模型（LLMs）中，通过自回归学习机制发展出的规划能力。项目ALPINE（Autoregressive Learning for Planning In NEtworks）旨在理论上调查Transformer模型是否能 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论