优惠 3D重建技术SparseCraft：从少量彩色图像中恢复出3D形状和视角依赖的外观，实现高效的3D重建和新视角合成

AI

推荐人：暴走AI 标签：SparseCraft AI

2年前 (2024-07-22)AI

来自法国的团队推出一种新颖的3D重建技术，名为SparseCraft。这项技术能够从少量彩色图像中恢复出3D形状和视角依赖的外观，实现高效的3D重建和新视角合成。简单来说，就是通过几张图片来构建一个物体的三维模型，并 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠提高自动音频字幕生成（ AAC）的效率

AI

推荐人：暴走AI 标签：AAC AI

2年前 (2024-07-22)AI

上海交通大学人工智能教育部重点实验室X-LANCE实验室和英国萨里大学视觉、语音和信号处理中心的研究人员发布论文，论文的主题是关于提高自动音频字幕生成（Automated Audio Captioning, AAC）的效率，即如何让计算机 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Phi-3 Safety Post-Training：调整和优化他们开发的Phi-3系列小型语言模型

AI

推荐人：暴走AI 标签：Phi-3 微软 AI

2年前 (2024-07-22)AI

微软发布论文，论文的主题是关于如何确保语言模型在实际应用中既安全又符合人类的偏好和安全考虑。具体来说，论文介绍了微软公司如何通过一系列的方法和步骤，来调整和优化他们开发的Phi-3系列小型语言模型（SLMs） ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 PlacidDreamer：用于将文本转换成3D模型的先进框架

AI

推荐人：暴走AI 标签：PlacidDreamer AI

2年前 (2024-07-22)AI

清华大学和快手的研究人员推出PlacidDreamer，这是一个用于将文本转换成3D模型的先进框架。想象一下，如果你能通过简单的文字描述，比如“一个红色的苹果”，然后计算机就能生成一个3D的苹果模型，这听起来是不是很酷 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 FLUTE：专门为使用查找表量化（LUT-quantized）的大语言模型设计

AI

推荐人：暴走AI 标签：FLUTE AI

2年前 (2024-07-22)AI

麻省理工学院、普罗夫迪夫数学高中和卡内基梅隆大学的研究人员推出FLUTE，FLUTE是一个灵活的查找表引擎，专门为使用查找表量化（LUT-quantized）的LLMs设计。简单来说，量化就是一种数据压缩技术，可以减少模型大小 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠研究编码基准测试SciCode：评估和提高语言模型在解决真实科学问题方面的能力

AI

推荐人：暴走AI 标签：SciCode AI

2年前 (2024-07-22)AI

SciCode是一个研究编码基准测试，这是一个由科学家们策划的挑战性编程任务集合。SciCode的目的是评估和提高语言模型（LMs）在解决真实科学问题方面的能力。这些问题涵盖了自然科学的多个领域，包括数学、物理、化学 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠谷歌推出新型稀疏自编码器JumpReLU SAEs：用于提高语言模型激活的重建保真度

AI

推荐人：暴走AI 标签：JumpReLU SAEs 谷歌 AI

2年前 (2024-07-22)AI

谷歌推出新型稀疏自编码器（Sparse Autoencoders, SAEs），称为JumpReLU SAEs，它用于提高语言模型（Language Model, LM）激活的重建保真度。简单来说，这种技术可以帮助我们从大量文本数据中提取出关键信息，并且以 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型视觉文本生成方法SceneVTG：能够在野外环境（即非受控的自然环境）中生成高质量的文本图像

AI

推荐人：暴走AI 标签：SceneVTG AI

2年前 (2024-07-22)AI

阿里巴巴和华中科技大学的研究人员推出一种新型视觉文本生成方法，称为SceneVTG（Scene Visual Text Generator），它能够在野外环境（即非受控的自然环境）中生成高质量的文本图像。这项技术特别关注于生成的文本图 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型视觉文档理解方法VisFocus：无需OCR技术，能够直接从图像中理解文档内容

AI

推荐人：暴走AI 标签：VisFocus AI

2年前 (2024-07-22)AI

以色列赖希曼大学和亚马逊AWS AI 实验室的研究人员推出新型视觉文档理解方法VisFocus，它是一种无需光学字符识别（OCR）的技术，能够直接从图像中理解文档内容。这种方法特别适用于处理包含大量文本的密集文档，比如 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 StabilityAI发布全新开源模型Stable Audio Open的技术报告

AI

推荐人：暴走AI 标签：StabilityAI Stable Audio Open AI

2年前 (2024-07-22)AI

StabilityAI在上个月公开新型文本到音频的生成模型Stable Audio Open后，终于在本月公开了技术报告，Stable Audio Open的特别之处在于，它是开放的，意味着任何人都可以使用和研究它，而且它是用Creative Commons（ ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠快手推出新型高效视觉-语言模型EVLM

AI

推荐人：暴走AI 标签：EVLM 快手 AI

2年前 (2024-07-22)AI

快手推出一种新型高效视觉-语言模型EVLM，它是为了更好地理解视觉信息并将其与语言模型结合起来而设计的。EVLM在多模态基准测试中的竞争力表现，以及在图像字幕和视频字幕任务中的优秀性能。这表明EVLM不仅在理论上 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

情报苹果推出高效能DCLM模型，挑战小型语言模型市场

推荐人：暴走AI 标签：DCLM 苹果

2年前 (2024-07-22)

苹果公司近期在自然语言处理（NLP）领域再次展示了其研发实力，推出了两款新的语言模型——DCLM-7B和DCLM-1B，这两款模型分别拥有69亿和14亿参数，旨在提供与现有顶级模型相当甚至更优秀的性能，同时显著降低训练所需 ...... 阅读全文

好 0 不好 0 0

推荐类别

栏目分类

优惠 3D重建技术SparseCraft：从少量彩色图像中恢复出3D形状和视角依赖的外观，实现高效的3D重建和新视角合成

优惠提高自动音频字幕生成（ AAC）的效率

优惠 Phi-3 Safety Post-Training：调整和优化他们开发的Phi-3系列小型语言模型

优惠 PlacidDreamer：用于将文本转换成3D模型的先进框架

优惠 FLUTE：专门为使用查找表量化（LUT-quantized）的大语言模型设计

优惠研究编码基准测试SciCode：评估和提高语言模型在解决真实科学问题方面的能力

优惠谷歌推出新型稀疏自编码器JumpReLU SAEs：用于提高语言模型激活的重建保真度

优惠新型视觉文本生成方法SceneVTG：能够在野外环境（即非受控的自然环境）中生成高质量的文本图像

优惠新型视觉文档理解方法VisFocus：无需OCR技术，能够直接从图像中理解文档内容

优惠 StabilityAI发布全新开源模型Stable Audio Open的技术报告

优惠快手推出新型高效视觉-语言模型EVLM

情报苹果推出高效能DCLM模型，挑战小型语言模型市场