优惠 Click-Gaussian:用于实时3D场景操作的交互式分割方法
标签:Click-Gaussian
AI
10个月前 (07-17)AI
LG电子和首尔国立大学的研究人员推出Click-Gaussian,这是一种用于实时3D场景操作的交互式分割方法。简单来说,Click-Gaussian能够让用户通过单次点击就能在三维空间中选择和分割出他们想要的对象,无论是粗略的大致形状还是精细的细节。例如,你是一名游戏设计师,需要在虚拟现实环境中快速修改场景中的多个物... 阅读全文
优惠 谷歌推出大规模、开放式的多语种手语平行语料库YouTube-SL-25
10个月前 (07-17)AI
谷歌推出YouTube-SL-25,这是一个大规模、开放式的多语种手语平行语料库。简单来说,它包含了超过25种不同手语的视频,这些视频从YouTube上收集而来,并且配有相应的字幕。这个项目的目标是改善手语与文本之间的翻译,让机器更好地理解和生成手语。例如,一个听障人士想在视频会议上与他人交流,但不熟悉对方的手语,Yo... 阅读全文
优惠 3D编辑技术DreamCatalyst:基于SDS(分数蒸馏采样)的编辑解释为扩散模型的逆过程
10个月前 (07-17)AI
韩国科学技术研究院人工智能研究生院推出3D编辑技术DreamCatalyst,它将基于SDS(分数蒸馏采样)的编辑解释为扩散模型的逆过程。我们的目标函数考虑了采样动力学,从而使DreamCatalyst的优化过程成为了编辑任务中扩散逆过程的一种近似。DreamCatalyst旨在缩短训练时间并提高编辑质量。DreamC... 阅读全文
优惠 NeedleBench框架:用来测试大语言模型处理长文本的能力
标签:NeedleBench
AI
10个月前 (07-17)AI
上海人工智能实验室和清华大学的研究人员推测NeedleBench框架,它专门用来测试大语言模型处理长文本的能力。这个框架通过设计一系列越来越具挑战性的任务,评估模型在处理多语言长文本时的检索和推理能力。这些任务涵盖了不同的文本长度和深度范围,允许在不同文本深度区域中策略性地插入关键数据点,以严格测试模型在多样化的上下文... 阅读全文
优惠 阿里巴巴推出新型工具套件“Data-Juicer Sandbox”:促进多模态数据和生成模型的协同开发
10个月前 (07-17)AI
阿里巴巴推出新型工具套件“Data-Juicer Sandbox”,它旨在促进多模态数据和生成模型的协同开发。多模态数据指的是包含文本、图像、视频和音频等多种类型的数据。生成模型则是指能够基于输入数据生成新内容的人工智能模型,例如根据文本描述生成图像或视频。 例如,你是一位厨师,需要准备一道复杂的菜肴,你需要各种食材(... 阅读全文
优惠 阿里巴巴集团Qwen团队推出大型音频-语言模型Qwen2-Audio
10个月前 (07-17)AI
阿里巴巴集团Qwen团队最新研发的大型音频-语言模型Qwen2-Audio。这个模型能够处理各种音频信号输入,并根据语音指令进行音频分析或直接文本回应。简单来说,Qwen2-Audio就像一个超级听力助手,不仅能听懂你说的话,还能根据你的声音指令做出反应。例如,你有一个智能助手,它不仅能听懂你说的话,还能分析你播放的音... 阅读全文