优惠 MagicMan：用于生成人类新视角图像的模型，能够在3D空间中意识到人类的形态和动作

AI

推荐人：暴走AI 标签：MagicMan AI

2年前 (2024-08-28)AI

清华大学深圳国际研究生院、腾讯人工智能实验室、香港科技大学、斯坦福大学和香港中文大学的研究人员推出MagicMan，它是一种用于生成人类新视角图像的模型，能够在3D空间中意识到人类的形态和动作。MagicMan通过使用 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型多模态大语言模型LLaVaOLMoBitNet1B：首个能够处理图像和文本输入并产生连贯文本响应的三元（Ternary）多模态大型语言模型

AI

推荐人：暴走AI 标签：LLaVaOLMoBitNet1B AI

2年前 (2024-08-28)AI

英特尔实验室推出新型多模态大语言模型LLaVaOLMoBitNet1B，它是首个能够处理图像和文本输入并产生连贯文本响应的三元（Ternary）多模态大型语言模型。这种模型通过使用三元权重量化技术，旨在实现在较小的计算成本上 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠量化新技术MobileQuant：解决在移动设备上部署大语言模型时面临的内存、能源和计算成本问题

AI

推荐人：暴走AI 标签：MobileQuant AI

2年前 (2024-08-28)AI

三星剑桥人工智能中心推出量化新技术MobileQuant，它旨在解决在移动设备上部署大语言模型（LLMs）时面临的内存、能源和计算成本问题。大型语言模型虽然在多种应用中表现出色，但要在手机等边缘设备上使用它们却存在 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型服务框架NanoFlow：通过利用设备内部的并行性，显著提高大语言模型的推理吞吐量

AI

推荐人：暴走AI 标签：NanoFlow AI

2年前 (2024-08-28)AI

华盛顿大学的研究人员推出新型服务框架NanoFlow，它旨在通过利用设备内部的并行性，显著提高大语言模型（LLMs）的推理吞吐量。在当今数字化时代，大型语言模型被广泛应用于聊天机器人、搜索引擎和办公软件等领域，对 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型AI系统MLMove：能够模仿专业《CS:GO》玩家的移动方式

AI

推荐人：暴走AI 标签：CS:GO MLMove AI

2年前 (2024-08-28)AI

新型AI系统MLMove，它能够模仿专业《反恐精英：全球攻势》（CS:GO）玩家的移动方式。想象一下，你在游戏中，需要与队友协调行动，比如一起进攻或防守某个区域，MLMove就像是一个虚拟的队友，能够学习并展现出专业玩 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠评估平台K-Sort Arena：专门用来测试和比较生成模型的性能

AI

推荐人：暴走AI 标签：K-Sort Arena AI

2年前 (2024-08-28)AI

中国科学院自动化研究所和加州大学伯克利分校的研究人员推出评估平台K-Sort Arena，它专门用来测试和比较生成模型的性能。你可以把生成模型想象成一位艺术家，它可以根据给定的文字描述创作出图片或视频。但就像评价 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新方法HiRED：提高高分辨率视觉-语言模型（VLMs）在资源受限环境中的推理效率

AI

推荐人：暴走AI 标签：HiRED AI

2年前 (2024-08-26)AI

弗吉尼亚理工大学、贝尔法斯特女王大学和都柏林大学学院的研究人员推出新方法HiRED（High-Resolution Early Dropping），它旨在提高高分辨率视觉-语言模型（VLMs）在资源受限环境中的推理效率。这些模型广泛应用于多 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 FLoD: 在定制渲染中将可调节的细节层次整合到三维高斯溅射中

AI

推荐人：暴走AI 标签：FLoD AI

2年前 (2024-08-26)AI

延世大学的研究人员推出一种名为FLoD（Flexible Level of Detail，灵活的细节层次）的技术，它被集成到了3D Gaussian Splatting（3DGS，三维高斯溅射）中，以实现可定制的渲染效果。3DGS是一种用于快速、高质量渲染 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 T3M：能够通过语音和文本的输入来生成逼真的3D人体动作

AI

推荐人：暴走AI 标签：T3M AI

2年前 (2024-08-26)AI

上海人工智能实验室和纽约大学的研究人员推出新技术T3M，它能够通过语音和文本的输入来生成逼真的3D人体动作。这项技术对于虚拟现实（VR）、游戏开发和电影制作等领域有着重要的应用价值。例如，你正在为一款虚拟现 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠多模态大语言模型基准评测MME-RealWorld：现实世界高分辨率场景下的性能评估

AI

推荐人：暴走AI 标签：MME-RealWorld AI

2年前 (2024-08-26)AI

中科院人工智能研究所、南京大学、香港科技大学、南洋理工大学、中科院大学、松鼠AI和Meta AI的研究人员推出多模态大语言模型基准MME-RealWorld，在现实世界高分辨率场景下的性能评估。简单来说，就是研究当这些智能 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠从单一文本提示生成全视角可探索全景三维场景的新型框架LayerPano3D

AI

推荐人：暴走AI 标签：LayerPano3D AI

2年前 (2024-08-26)AI

上海交通大学、香港中文大学、浙江大学、上海人工智能实验室、斯坦福大学和南洋理工大学的研究人员推出LayerPano3D，这是一种从单一文本提示生成全视角可探索全景三维场景的新型框架。我们的核心见解是将参考二维全 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠构建和深入理解视觉-语言模型！Hugging Face推出理解视觉-语言模型Idefics3-8B

AI

推荐人：暴走AI 标签：Hugging Face Idefics3-8B AI

2年前 (2024-08-26)AI

Hugging Face发布论文，论文的主题是关于构建和深入理解视觉-语言模型（VLMs）。VLMs是一种人工智能模型，它们能够处理和理解图像和文本，然后将这些信息综合起来输出文本。简单来说，这些模型就像一个能够“看”图片 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

推荐类别

栏目分类

AI

优惠 MagicMan：用于生成人类新视角图像的模型，能够在3D空间中意识到人类的形态和动作

优惠新型多模态大语言模型LLaVaOLMoBitNet1B：首个能够处理图像和文本输入并产生连贯文本响应的三元（Ternary）多模态大型语言模型

优惠量化新技术MobileQuant：解决在移动设备上部署大语言模型时面临的内存、能源和计算成本问题

优惠新型服务框架NanoFlow：通过利用设备内部的并行性，显著提高大语言模型的推理吞吐量

优惠新型AI系统MLMove：能够模仿专业《CS:GO》玩家的移动方式

优惠评估平台K-Sort Arena：专门用来测试和比较生成模型的性能

优惠新方法HiRED：提高高分辨率视觉-语言模型（VLMs）在资源受限环境中的推理效率

优惠 FLoD: 在定制渲染中将可调节的细节层次整合到三维高斯溅射中

优惠 T3M：能够通过语音和文本的输入来生成逼真的3D人体动作

优惠多模态大语言模型基准评测MME-RealWorld：现实世界高分辨率场景下的性能评估

优惠从单一文本提示生成全视角可探索全景三维场景的新型框架LayerPano3D

优惠构建和深入理解视觉-语言模型！Hugging Face推出理解视觉-语言模型Idefics3-8B