来自上海人工智能实验室、浙江大学和香港中文大学的研究人员推出新型的三维场景理解模型——Grounded 3D-LLM(Grounded 3D Large Language Model)。这个模型旨在通过结合三维视觉和语言模型,来处理和理解复杂的三维场景。下面我将用通俗易懂的语言来介绍这个模型的主要功能、特点、工作原理以... 阅读全文
Two Platforms推出多语言大语言模型(LLM)架构SUTRA,它能够理解、推理并用超过50种语言生成文本。SUTRA的设计独特之处在于它将核心概念理解与语言特定处理分离开来,这有助于实现可扩展和高效的多语言对齐和学习。SUTRA采用了专家混合(Mixture of Experts,MoE)框架,既用于语言处理... 阅读全文
微软推出大型信息丰富的网络数据集MS MARCO Web Search,它包含了数百万真实点击的查询-文档标签。这个数据集是首次尝试,旨在模拟现实世界中的网页文档和查询分布,为各种类型的下游任务提供丰富的信息,并鼓励在多个研究领域进行创新,例如通用的端到端神经索引器模型、通用嵌入模型,以及使用大型语言模型的下一代信息访... 阅读全文