优惠 WILDVISION:用于评估视觉-语言模型(VLMs)在现实世界中表现的在线平台
                        
                        标签:WILDVISION
                        AI
                            
                    
                    1年前 (2024-06-18)AI
                
                    艾伦人工智能研究所、华盛顿大学、加州大学圣巴巴拉分校和滑铁卢大学的研究人员推出WILDVISION,它是一个用于评估视觉-语言模型(VLMs)在现实世界中表现的在线平台。WILDVISION通过收集人类偏好来评估这些模型,特别是在多轮对话和多模态交互中的表现。例如,你是一名AI研究员,想要比较不同视觉-语言模型在理解一...                    阅读全文
                
            优惠 在线视频大型语言模型VideoLLM-online:专为流媒体视频设计,能够实时理解和生成与视频内容相关的对话
1年前 (2024-06-18)AI
                
                    新加坡国立大学和Meta的研究人员推出在线视频大型语言模型VideoLLM-online,它专为流媒体视频设计,能够实时理解和生成与视频内容相关的对话。例如,你戴着一副智能眼镜,而这副眼镜能够实时分析你看到的场景,并与你进行交流,比如在你做饭的时候告诉你下一步该做什么,或者在你观看教学视频时回答你的问题,这就是Vide...                    阅读全文
                
            优惠 大型图像描述数据集PixelProse:包含了超过1600万个由先进的视觉-语言模型自动生成的图像描述
                        
                        标签:PixelProse
                        AI
                            
                    
                    1年前 (2024-06-18)AI
                
                    马里兰大学帕克分校的研究人员推出大型图像描述数据集PixelProse,PixelProse包含了超过1600万个由先进的视觉-语言模型自动生成的图像描述。例如,一个艺术家想要了解他的画作在视觉上给人的感受,PixelProse可以帮助分析图像的美学属性并生成描述,这样艺术家就可以得到关于作品可能给观众带来的情感体验的...                    阅读全文
                
            优惠 大规模多模态数据集OmniCorpus:包含了十亿级别的图像和文本数据
1年前 (2024-06-17)AI
                
                    上海人工智能实验室、哈尔滨工业大学、南京大学、复旦大学、香港中文大学、商汤科技研究院和清华大学的研究团队推出大规模多模态数据集OmniCorpus,它包含了十亿级别的图像和文本数据,这些数据以自然文档的格式排列,模仿了互联网数据的呈现方式,也符合人类的阅读习惯。这个数据集的建立旨在推动多模态大型语言模型(MLLMs)的...                    阅读全文
                
            优惠 Skywork-MoE:具有1460亿参数和16个专家的高性能混合专家模型
1年前 (2024-06-17)AI
                
                    昆仑万维旗下天工AI发布大语言模型(LLM)训练技术Skywork-MoE,Skywork-MoE是一个具有1460亿参数和16个专家的高性能混合专家(Mixture-of-Experts,简称MoE)模型。这个模型是从Skywork-13B模型的密集型检查点初始化而来的。通过实验结果表明,Skywork-MoE在多个...                    阅读全文
                
            











					
					
					
					