优惠 新型大型视频语言模型Grounded-VideoLLM:擅长于理解视频中的精细时刻,并能够推理出具体发生在视频哪个时刻的事情
2年前 (2024-10-09)AI
加州大学戴维斯分校、弗吉尼亚理工大学、香港中文大学、英伟达、Adobe Research 、复旦大学和Meta AI的研究人员推出一种新型大型视频语言模型Grounded-VideoLLM。这个模型特别擅长于理解视频中的精细时刻,并能够推理出具体发生在视频哪个时刻的事情。例如,你是一名视频编辑,正在寻找一个视频中所有“... 阅读全文
















