优惠 3D模型框架Interactive3D:它允许用户通过交互式操作来精确控制3D对象的生成过程
标签:Interactive3D
AI
1年前 (2024-04-27)AI
来自香港科大、香港中文大学、 商汤科技和上海人工智能实验室的研究人员推出创新框架Interactive3D,它允许用户通过交互式操作来精确控制3D对象的生成过程。这个框架特别适用于那些需要高度个性化和定制化3D模型的场景。例如,你想要创建一个“骑在喷火龙上的黑暗骑士”的3D模型。使用Interactive3D,你可以先... 阅读全文
优惠 腾讯发布基准测试工具SEED-Bench-2-Plus:专门用于评估多模态大语言模型在处理富含文本的视觉内容方面的性能
1年前 (2024-04-27)AI
腾讯发布基准测试工具SEED-Bench-2-Plus,它专门用于评估多模态大语言模型(MLLMs)在处理富含文本的视觉内容方面的性能。这类场景在现实世界中非常普遍,例如图表、地图和网页等,它们都包含了大量的文本信息嵌入在图像中。 主要功能和特点: 针对性的评估:SEED-Bench-2-Plus包含2.3K个多项选择... 阅读全文
优惠 开源多模态大语言模型InternVL 1.5,旨在缩小开源模型与商业专有模型在多模态理解能力方面的差距
标签:InternVL 1.5
AI
1年前 (2024-04-27)AI
来自上海人工智能实验室、商汤科技研究院、清华大学、南京大学、复旦大学和香港中文大学的研究人员推出开源多模态大语言模型InternVL 1.5,旨在缩小开源模型与商业专有模型在多模态理解能力方面的差距。多模态大语言模型结合了视觉和语言处理的能力,可以处理包含文本和图像的任务,比如解释图片内容、理解文档中的文本等。 Git... 阅读全文
优惠 SoM-LLaVA:提高多模态大语言模型视觉理解能力的新方法,它通过在图像上添加带标签的标记(tags)来增强模型将视觉对象与文本标记关联的能力
1年前 (2024-04-27)AI
加州大学圣地亚哥分校、微软公司、加州大学圣巴巴拉分校的研究人员推出list items one by one,这是一种提高多模态大语言模型视觉理解能力的新方法,它通过在图像上添加带标签的标记(tags)来增强模型将视觉对象与文本标记关联的能力。例如,我们有一张包含笔记本电脑、椅子、显示器和台灯的办公室照片。使用SoM提... 阅读全文
优惠 免费空间服务Easyupload.io:匿名分享文件最大 10 GB、保存 30 天
标签:Easyupload.io
工具
1年前 (2024-04-27)工具
Easyupload.io作为一款传统的免费空间服务,以其简单易用的界面、大容量支持、匿名使用、灵活设定以及合理的免费用户保存期限,非常适合于临时、匿名、快速分享大文件的场景。然而,用户在选择时应重点考察其上下载速度与稳定性是否满足个人需求,并根据自身对文件保存期限、文件大小限制以及是否愿意付费升级等因素综合判断其是否... 阅读全文
优惠 阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B
标签:Qwen1.5-110B
AI
1年前 (2024-04-27)AI
阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B。此前它发布了 0.5B、1.8B、4B、7B、14B 和 72B 不同规模参数的版本。阿里巴巴称,Qwen1.5-110B 模型在基础能力评估中与 Meta-Llama3-70B 相媲美,在 Chat 评估中表现出色,包括 MT-Bench 和 Alpaca... 阅读全文