优惠 新型大型多模态模型LLaVA-OneVision:提高计算机视觉任务的性能,特别是在处理单图像、多图像和视频场景时的能力
2年前 (2024-08-07)AI
这篇论文介绍了一个名为LLaVA-OneVision的新型大型多模态模型(LMMs),它是由多个机构共同开发的,包括字节跳动、南洋理工大学、香港中文大学和香港科技大学。这个模型的核心目标是提高计算机视觉任务的性能,特别 ...... 阅读全文
优惠 开源框架RAG Foundry:专门用于增强大语言模型,特别是针对检索增强型生成(RAG)的应用场景
标签:RAG Foundry
AI
2年前 (2024-08-07)AI
英特尔实验室推出开源框架RAG Foundry,它专门用于增强大语言模型(LLMs),特别是针对检索增强型生成(Retrieval-Augmented Generation,简称RAG)的应用场景。简单来说,RAG Foundry是一个多功能工具箱,它可以帮 ...... 阅读全文
优惠 MeshAnything V2系统:能够自动生成与给定形状对齐的艺术家创造的网格的模型
2年前 (2024-08-07)AI
洋理工大学、清华大学、伦敦帝国理工学院和西湖大学的研究人员推出MeshAnything V2系统,它是一个能够自动生成与给定形状对齐的艺术家创造的网格(Artist-Created Meshes,简称AM)的模型。简单来说,MeshAnything V ...... 阅读全文
百科 Google Lens 登陆 Chrome 浏览器,教你如何启动它!
标签:Google Lens
2年前 (2024-08-07)
Google Lens(谷歌智能镜头)现已登陆 Chrome 浏览器,带来与移动设备上的“Circle to Search(画圈搜索)”相似的全新体验。这不仅提升了网页搜索的便捷性,更利用 AI 技术,让你在浏览过程中,无需离开当前页面即可 ...... 阅读全文
















