AI
优惠 新的流匹配方法Consistency-FM:用于生成模型的算法框架
标签:Consistency-FM
AI
1年前 (2024-07-03)AI
“Consistency Flow Matching”(Consistency-FM)这是一种新的流匹配(Flow Matching, FM)方法,一种用于生成模型的算法框架。这种方法的核心在于通过普通微分方程(ODEs)定义概率路径,从而在噪声和数据样本之间进行转换。Consistency-FM特别强调在速度场中显式... 阅读全文
优惠 MInference:加速大语言模型的预填充(pre-filling)阶段,特别是在处理长文本时
标签:MInference
AI
1年前 (2024-07-03)AI
微软公司和 萨里大学的研究人员推出新技术MInference(Million-tokens Inference),它旨在加速大语言模型的预填充(pre-filling)阶段,特别是在处理长文本时。预填充阶段是LLMs生成文本前的一个重要步骤,但当文本长度增加时,这一阶段的计算成本会变得非常高。 项目主页:https:/... 阅读全文
优惠 大规模高质量文本到视频生成数据集OpenVid-1M以及多模态视频扩散变换器MVDiT
标签:OpenVid-1M
AI
1年前 (2024-07-03)AI
南京大学、字节跳动和南开大学的研究人员推出大规模高质量文本到视频生成数据集OpenVid-1M,以及一个新颖的多模态视频扩散变换器(MVDiT)。论文还提到了MVDiT的一些限制,比如在模拟复杂自然场景的动态和运动时可能会产生不真实的视频,以及目前还不能模拟长时间动态,这些都是未来研究需要解决的问题。 项目主页:ht... 阅读全文
优惠 Meta推出Meta 3D Gen:1 分钟内生成高质量 3D 资产
1年前 (2024-07-03)AI
Meta推出Meta 3D Gen(简称3DGen)的先进技术,它是一个文本到3D资产生成的快速通道。这项技术的主要特点是能够快速生成高质量的3D模型和纹理,几乎达到了一分钟以内的惊人速度。3DGen支持基于物理的渲染(PBR),这对于3D资产在现实世界应用中的重新照明至关重要。此外,3DGen还能够使用用户提供的额外... 阅读全文
优惠 Step-Controlled DPO:提升大语言模型在数学推理等下游任务上的表现
1年前 (2024-07-02)AI
香港中文大学多媒体实验室推出新方法Step-Controlled DPO(SCDPO),用于提升大语言模型(LLMs)在数学推理等下游任务上的表现。例如,我们有一个超级聪明的电脑助手,它可以理解和解决复杂的数学问题,但有时它可能会在解题过程中出错。SCDPO的作用就是帮助这个电脑助手更准确地理解问题并找到正确的解题步骤... 阅读全文
优惠 新型树状搜索算法LiteSearch:为了提高大语言模型在复杂数学推理任务上的性能而设计
标签:LiteSearch
AI
1年前 (2024-07-02)AI
厦门大学信息学院和腾讯人工智能实验室的研究人员推出一种新型的树状搜索算法——LiteSearch,它是为了提高大语言模型(LLMs)在复杂数学推理任务上的性能而设计的。在以往的研究中,树状搜索算法(例如蒙特卡洛树搜索,MCTS)已被证明可以显著提升LLMs的性能,但这些算法常常因为搜索策略上的浪费而需要超过贪婪解码10... 阅读全文