优惠为处理长视频内容而设计的多模态视觉语言模型LongVILA

AI

推荐人：暴走AI 标签：LongVILA AI

2年前 (2024-08-21)AI

英伟达、麻省理工学院、加州大学伯克利分校和德克萨斯大学奥斯汀分校的研究人员推出LongVILA系统，它是一个为处理长视频内容而设计的多模态视觉语言模型。例如，我们有一段非常长的视频，比如一场足球比赛或者一个长 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 JPEG-LM：将大语言模型应用于图像和视频生成领域，通过使用标准的编解码器（如JPEG和AVC/H.264）来表示和生成图像与视频

AI

推荐人：暴走AI 标签：JPEG-LM AI

2年前 (2024-08-19)AI

华盛顿大学和Meta的研究人员发布论文，论文的主题是探讨如何将大语言模型（LLMs）应用于图像和视频生成领域，提出了一种新颖的方法，即通过使用标准的编解码器（如JPEG和AVC/H.264）来表示和生成图像与视频。这种方 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠用于开发大型多模态模型的新框架xGen-MM

AI

推荐人：暴走AI 标签：xGen-MM AI

2年前 (2024-08-19)AI

Salesforce AI 研究和华盛顿大学的研究人员推出新框架xGen-MM（也被称为BLIP-3），它是用于开发大型多模态模型（LMMs）的。多模态模型，你可以想象成一种超级大脑，不仅能理解文本（比如书籍、网页上的文字），还能 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Gravatar推出「自定义域名」功能，免费使用.Link域名一年！

工具

推荐人：暴走AI 标签：Gravatar 工具

2年前 (2024-08-19)工具

Gravatar 是一项广为人知的个人头像托管服务，尤其对于那些经历过早期 WordPress 自建博客时代的人来说并不陌生。那时，人们常常在文章下方的评论区留下反馈，通过注册 Gravatar 并上传头像以及关联邮箱，就可以在支 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠跨平台提词器工具FlowPrompter

工具

推荐人：暴走AI 标签：FlowPrompter 提词器工具

2年前 (2024-08-17)工具

FlowPrompter 是一款简单易用的提词器工具，目前免费使用，拥有 Windows、macOS 客户端，以及 Web 界面，适合于网络会议、屏幕录制、直播、演讲等不同场合。界面仅自己可见，针对屏幕共享、录制、截图均隐藏。@Appin ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠免费在线Logo生成器LogoFast，无需设计经验无需注册，打开即用

工具

推荐人：暴走AI 标签：LogoFast 工具

2年前 (2024-08-17)工具

LogoFast 是一款免费的在线Logo生成器，无需安装软件或注册账号，只需在浏览器中打开即可使用。该工具包含 Lucide 图标集（超过 1000 种图案），用户可以轻松选择图案并进行编辑，包括调整标志的形状、尺寸、旋转角 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠阿里巴巴推出多模态大语言模型mPLUG-Owl3

AI

推荐人：暴走AI 标签：mPLUG-Owl3 多模态大语言模型 AI

2年前 (2024-08-16)AI

阿里巴巴推出多模态大语言模型mPLUG-Owl3，它在处理单图像、多图像和视频任务方面取得了显著的进展。例如，你向mPLUG-Owl3展示一系列图片，并询问其中的天气情况，模型可以分析这些图片并告诉你哪一张是雪天。或者， ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 HeadGAP：可以从极少的图像（甚至是单张图像）创建出逼真且可动的3D头部头像

AI

推荐人：暴走AI 标签：HeadGAP AI

2年前 (2024-08-16)AI

字节跳动和上海科技大学的研究人员推出HeadGAP，它可以从极少的图像（甚至是单张图像）创建出逼真且可动的3D头部头像。想象一下，如果你只有一张自己的照片，HeadGAP能够用它来生成一个看起来非常像你，并且可以做出 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型机器人触觉表示学习方法UniT：帮助机器人更好地理解和使用这种触觉信息

AI

推荐人：暴走AI 标签：UniT AI

2年前 (2024-08-16)AI

普渡大学和阿肯色大学的研究人员推出新型机器人触觉表示学习方法UniT，机器人需要通过触觉来感知和操作物体，就像人类通过手触摸东西一样。UniT就是帮助机器人更好地理解和使用这种触觉信息的一种技术。此外，论文还 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 OpenResearcher：利用人工智能（AI）技术来加速科学研究进程

AI

推荐人：暴走AI 标签：OpenResearcher AI

2年前 (2024-08-16)AI

创新平台OpenResearcher，它利用人工智能（AI）技术来加速科学研究进程。想象一下，研究人员每天都在与成堆的学术论文打交道，试图跟上他们领域内的最新进展，这既耗时又费力。OpenResearcher就像一个智能助手，可以 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型大语言模型LongWriter：能够生成超过10,000个词的超长文本

AI

推荐人：暴走AI 标签：LongWriter AI

2年前 (2024-08-16)AI

清华大学和智谱AI的研究人员推出新型大语言模型LongWriter，它能够生成超过10,000个词的超长文本。这在人工智能领域是一个重要的突破，因为现有的大型语言模型虽然能够处理长达100,000个词的输入，但在生成文本时却 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型图像编辑工具MVInpainter：能够学习多视角下一致的图像修复技术，以连接二维（2D）图像编辑和三维（3D）场景编辑

AI

推荐人：暴走AI 标签：MVInpainter AI

2年前 (2024-08-16)AI

复旦大学、阿里巴巴达摩院和湖畔实验室的研究人员推出新型图像编辑工具MVInpainter，它能够学习多视角下一致的图像修复技术，以连接二维（2D）图像编辑和三维（3D）场景编辑。简单来说，MVInpainter能够在多个视角 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

推荐类别

栏目分类

优惠为处理长视频内容而设计的多模态视觉语言模型LongVILA

优惠 JPEG-LM：将大语言模型应用于图像和视频生成领域，通过使用标准的编解码器（如JPEG和AVC/H.264）来表示和生成图像与视频

优惠用于开发大型多模态模型的新框架xGen-MM

优惠 Gravatar推出「自定义域名」功能，免费使用.Link域名一年！

优惠跨平台提词器工具FlowPrompter

优惠免费在线Logo生成器LogoFast，无需设计经验无需注册，打开即用

优惠阿里巴巴推出多模态大语言模型mPLUG-Owl3

优惠 HeadGAP：可以从极少的图像（甚至是单张图像）创建出逼真且可动的3D头部头像

优惠新型机器人触觉表示学习方法UniT：帮助机器人更好地理解和使用这种触觉信息

优惠 OpenResearcher：利用人工智能（AI）技术来加速科学研究进程

优惠新型大语言模型LongWriter：能够生成超过10,000个词的超长文本

优惠新型图像编辑工具MVInpainter：能够学习多视角下一致的图像修复技术，以连接二维（2D）图像编辑和三维（3D）场景编辑