情报苹果推出全球开发者学院AI技能培训课程

推荐人：暴走AI 标签：苹果

2年前 (2024-06-19)

苹果公司宣布，将在巴西、印尼、意大利、沙特阿拉伯、韩国和美国的Apple开发者学院推出全新的人工智能（AI）技能培训课程。这一举措旨在为学生和教育工作者提供掌握AI技术的机会，帮助他们为在快速发展的iOS应用程序 ...... 阅读全文

好 0 不好 0 0

优惠开源macOS应用「noTunes」：阻止 Apple Music、iTunes 自动启动

工具

推荐人：暴走AI 标签：macOS noTunes 工具

2年前 (2024-06-19)工具

「noTunes」是一个开源的macOS应用，它提供了一项简单却非常实用的功能：在后台运行，阻止iTunes或Apple Music的自动启动。这对于经常遇到音乐应用不定时自动打开问题的用户来说，是一个有效的解决方案。主要功能： ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 4Real：从文本提示生成接近照片级逼真度的四维场景（4D场景）的生成框架

AI

推荐人：暴走AI 标签：4Real AI

2年前 (2024-06-18)AI

Snap和卡内基梅隆大学的研究人员推出4Real系统，它是一个能够从文本提示生成接近照片级逼真度的四维场景（4D场景）的生成框架。四维在这里指的是包括时间维度的三维动态场景。4Real利用了视频扩散模型（video diffus ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠全新自动化优化方法TEXTGRAD：专门为复杂的人工智能（AI）系统设计

AI

推荐人：暴走AI 标签：TEXTGRAD AI

2年前 (2024-06-18)AI

斯坦福大学推出TEXTGRAD框架，它是一种全新的自动化优化方法，专门为复杂的人工智能（AI）系统设计。例如，有一个非常聪明的助手，它能够理解你给出的指令，然后用自然语言给你反馈，告诉你如何改进你的工作或解决问 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型世界模型Pandora：通过生成视频来模拟未来世界的状态，并且可以接受自然语言的动作指令进行实时控制

AI

推荐人：暴走AI 标签：Pandora 世界模型 AI

2年前 (2024-06-18)AI

Maitrix.org、加州大学圣地亚哥分校、MBZUAI的研究人员推出新型世界模型Pandora，它能够通过生成视频来模拟未来世界的状态，并且可以接受自然语言的动作指令进行实时控制。简单来说，Pandora就像是一个高级的虚拟助 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠一种基于L2范数的简单而有效的策略，用于压缩大语言模型中的键值（KV）缓存

AI

推荐人：暴走AI 标签：大语言模型 AI

2年前 (2024-06-18)AI

罗马大学和爱丁堡大学发布论文，提出了一种基于L2范数的简单而有效的策略，用于压缩大型语言模型（LLMs）中的键值（KV）缓存。在大型语言模型处理长文本时，KV缓存是一个关键组件，它保存了之前token的键和值，以避 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠适用于多种类型文档的新型信息检索范式“文档截图嵌入（DSE）”

AI

推荐人：暴走AI 标签：DSE 文档截图嵌入 AI

2年前 (2024-06-18)AI

滑铁卢大学推出新型信息检索范式“文档截图嵌入”（Document Screenshot Embedding，简称DSE），DSE在实验中表现出与传统文本检索方法（如BM25）相比更高的检索准确性，并且在混合模态任务中也显示出其有效性。这表明D ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MAGPIE：从大语言模型中合成高质量的指令数据

AI

推荐人：暴走AI 标签：MAGPIE AI

2年前 (2024-06-18)AI

华盛顿大学和艾伦人工智能研究所的研究人员推出新型方法MAGPIE，它能够从大语言模型中合成高质量的指令数据。例如，你有一个非常聪明的助手，但它需要一些具体的指令来完成特定的任务。MAGPIE就像是一个能够教这个助 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型基准测试MMWorld：为了全面评估多模态大语言模型在视频理解方面的能力而设计

AI

推荐人：暴走AI 标签：MMWorld 多模态大语言 AI

2年前 (2024-06-18)AI

新型基准测试MMWorld，它是为了全面评估多模态大语言模型（MLLMs）在视频理解方面的能力而设计的。MLLMs是一类能够处理和理解图像、文本和视频等多种模态输入的人工智能模型。MMWorld通过提供丰富的视频内容和相关问 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠视频大语言模型VideoLLaMA 2：为了提升视频和音频导向任务中的空间-时间建模和音频理解能力而设计

AI

推荐人：暴走AI 标签：VideoLLaMA 2 视频大语言模型 AI

2年前 (2024-06-18)AI

阿里巴巴集团达摩院推出视频大语言模型VideoLLaMA 2，它是为了提升视频和音频导向任务中的空间-时间建模和音频理解能力而设计的。例如，你想让一个人工智能系统观看一段视频并回答有关视频内容的问题，或者描述视频 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠大规模数据集3D-GRAND：为了提升三维语言模型的理解和减少幻觉而设计

AI

推荐人：暴走AI 标签：3D-GRAND AI

2年前 (2024-06-18)AI

密歇根大学和纽约大学的研究人员推出大规模数据集3D-GRAND，它是为了提升三维语言模型（3D-LLMs）的理解和减少幻觉（hallucination，即模型错误地生成不存在的对象或信息）而设计的。例如，你有一个智能助手，它能 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠视频编辑框架NaRCan：能够生成高质量的自然规范图像，以代表输入视频

AI

推荐人：暴走AI 标签：NaRCan 视频编辑框架 AI

2年前 (2024-06-18)AI

阳明交通大学推出视频编辑框架NaRCan，它能够生成高质量的自然规范图像（canonical images），以代表输入视频。这些规范图像非常适合用于各种视频编辑任务，比如风格转换、动态分割和手写等。NaRCan在多个视频编辑任 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

推荐类别

栏目分类

情报苹果推出全球开发者学院AI技能培训课程

优惠开源macOS应用「noTunes」：阻止 Apple Music、iTunes 自动启动

优惠 4Real：从文本提示生成接近照片级逼真度的四维场景（4D场景）的生成框架

优惠全新自动化优化方法TEXTGRAD：专门为复杂的人工智能（AI）系统设计

优惠新型世界模型Pandora：通过生成视频来模拟未来世界的状态，并且可以接受自然语言的动作指令进行实时控制

优惠一种基于L2范数的简单而有效的策略，用于压缩大语言模型中的键值（KV）缓存

优惠适用于多种类型文档的新型信息检索范式“文档截图嵌入（DSE）”

优惠 MAGPIE：从大语言模型中合成高质量的指令数据

优惠新型基准测试MMWorld：为了全面评估多模态大语言模型在视频理解方面的能力而设计

优惠视频大语言模型VideoLLaMA 2：为了提升视频和音频导向任务中的空间-时间建模和音频理解能力而设计

优惠大规模数据集3D-GRAND：为了提升三维语言模型的理解和减少幻觉而设计

优惠视频编辑框架NaRCan：能够生成高质量的自然规范图像，以代表输入视频