优惠针对长视频理解的视频-大语言模型Koala：帮助模型理解长达数分钟的视频内容，并能够回答关于视频的问题

AI

推荐人：暴走AI 标签：Koala 视频-大语言模型 AI

2年前 (2024-04-10)AI

来自波士顿大学、中国电子科技大学和Adobe Research的研究人员推出Koala，它是一种针对长视频理解的视频-大语言模型（Video-Large Language Model，简称vLLM）。Koala的目标是帮助模型理解长达数分钟的视频内容，并 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠基于文本编辑NeRF（神经辐射场）场景DATENeRF：从2D图像中重建3D场景

AI

推荐人：暴走AI 标签：DATENeRF AI

2年前 (2024-04-10)AI

Adobe推出DATENeRF，它用于基于文本编辑NeRF（神经辐射场）场景。NeRF是一种可以创建和渲染3D环境的技术，它通过从2D图像中重建场景的3D表示来实现。DATENeRF的关键特点是它能够利用场景的深度信息来指导基于文本 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MuPT：专门用于生成符号音乐的大语言模型

推荐人：暴走AI 标签：MuPT 大语言模型

2年前 (2024-04-10)AI

这篇论文介绍了一个名为MuPT（Music Pretrained Transformer）的模型，它是一个专门用于生成符号音乐的大型语言模型。符号音乐是指用特定的符号系统（如ABC记谱法）来表示的音乐，这种表示方法更接近于人类阅读和理 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠浦语·灵笔2系列新模型InternLM-XComposer2-4KHD：在处理图像和文本方面有着显著的进步

AI

推荐人：暴走AI 标签：InternLM-XComposer2-4KHD AI

2年前 (2024-04-10)AI

上海人工智能实验室推出浦语·灵笔2系列新模型InternLM-XComposer2-4KHD，这是一款开创性大型视觉-语言模型（LVLM），这个模型在处理图像和文本方面有着显著的进步。例如，你有一个能够理解图片内容并回答有关图片问 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 LLM2Vec：将大型的解码器模型转换成强大的文本编码器

AI

推荐人：暴走AI 标签：LLM2Vec AI

2年前 (2024-04-10)AI

这篇论文介绍了一个名为LLM2Vec的方法，它能够将大型的解码器模型（decoder-only LLMs）转换成强大的文本编码器。这些解码器模型在很多自然语言处理（NLP）任务中都是最先进的，但在文本嵌入任务中，它们的能力还没 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 SambaLingo：针对大语言模型进行多语言适应性调整的研究项目

AI

推荐人：暴走AI 标签：SambaLingo 大语言模型 AI

2年前 (2024-04-10)AI

这篇论文的主题是“SambaLingo”，这是一个针对大型语言模型（LLMs）进行多语言适应性调整的研究项目。简单来说，SambaLingo的目标是让大型语言模型能够理解和生成更多不同语言的文本，弥补目前LLMs在多种语言能力上的 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 CodecLM：用于生成与特定指令分布和大语言模型对齐的高质量合成数据的通用框架

AI

推荐人：暴走AI 标签：CodecLM AI

2年前 (2024-04-10)AI

谷歌云和搜索团队推出CodecLM，它是一个用于生成与特定指令分布和大语言模型（LLMs）对齐的高质量合成数据的通用框架。简单来说，CodecLM就像是一个智能的数据制造工厂，能够根据需要生产出适合训练语言模型的数据。 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠大语言模型在处理表格数据时的记忆力和学习能力

AI

推荐人：暴走AI 标签：大语言模型 AI

2年前 (2024-04-10)AI

图宾根大学图宾根人工智能中心和微软搜索团队发布论文探讨大语言模型（Large Language Models，简称LLMs）在处理表格数据时的记忆力和学习能力。用通俗的语言来说，就像是研究一个学习了很多知识的智能助手，当它遇 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠多模态模型OmniFusion：结合了大语言模型和视觉模态的适配器，以提高人工智能系统处理和理解文本和图像数据的能力

AI

推荐人：暴走AI 标签：OmniFusion 多模态模型 AI

2年前 (2024-04-10)AI

这篇论文介绍了一个名为OmniFusion的多模态模型，它结合了大型语言模型（LLM）和视觉模态的适配器，以提高人工智能系统处理和理解文本和图像数据的能力。OmniFusion模型在多个视觉-语言基准测试中表现出色，尤其是在 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MiniCPM: 揭示端侧大语言模型的无限潜力

AI

推荐人：暴走AI 标签：MiniCPM 面壁智能 AI

2年前 (2024-04-10)AI

面壁智能与清华大学自然语言处理实验室共同开源的系列端侧大模型MiniCPM，旨在探索在资源有限的情况下，如何有效地训练和部署语言模型。MiniCPM系列包括两个主要模型，分别是拥有1.2亿和2.4亿非嵌入参数的变体。尽管 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 RWKV推出两个新型的序列模型——Eagle（RWKV-5）和Finch（RWKV-6）

AI

推荐人：暴走AI 标签：RWKV-5 RWKV-6 AI

2年前 (2024-04-10)AI

RWKV推出两个新型的序列模型——Eagle（RWKV-5）和Finch（RWKV-6），它们是在之前RWKV-4模型的基础上进行改进的。这些模型的目标是提高自然语言处理（NLP）任务的效率，同时保持或提升模型的性能。RWKV的架构设计进步 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MCC-HO：从单个RGB图像或视频中重建手持物体的三维模型

AI

推荐人：暴走AI 标签：MCC-HO 三维模型 AI

2年前 (2024-04-10)AI

这篇论文的主题是关于如何从单个RGB图像或视频中重建手持物体的三维模型。这项技术特别关注在户外环境中，当手遮挡了物体的大部分视线时，如何准确地重建物体的三维结构。论文中提出了一个名为MCC-HO的模型，它结合 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

推荐类别

栏目分类

优惠针对长视频理解的视频-大语言模型Koala：帮助模型理解长达数分钟的视频内容，并能够回答关于视频的问题

优惠基于文本编辑NeRF（神经辐射场）场景DATENeRF：从2D图像中重建3D场景

优惠 MuPT：专门用于生成符号音乐的大语言模型

优惠浦语·灵笔2系列新模型InternLM-XComposer2-4KHD：在处理图像和文本方面有着显著的进步

优惠 LLM2Vec：将大型的解码器模型转换成强大的文本编码器

优惠 SambaLingo：针对大语言模型进行多语言适应性调整的研究项目

优惠 CodecLM：用于生成与特定指令分布和大语言模型对齐的高质量合成数据的通用框架

优惠大语言模型在处理表格数据时的记忆力和学习能力

优惠多模态模型OmniFusion：结合了大语言模型和视觉模态的适配器，以提高人工智能系统处理和理解文本和图像数据的能力

优惠 MiniCPM: 揭示端侧大语言模型的无限潜力

优惠 RWKV推出两个新型的序列模型——Eagle（RWKV-5）和Finch（RWKV-6）

优惠 MCC-HO：从单个RGB图像或视频中重建手持物体的三维模型