优惠新型文本到视频生成基准测试ChronoMagic-Bench

AI

推荐人：暴走AI 标签：ChronoMagic-Bench AI

2年前 (2024-06-29)AI

新型文本到视频（Text-to-Video, T2V）生成基准测试ChronoMagic-Bench。这个基准测试专门用来评估T2V模型在生成具有显著变化幅度和时间连贯性的延时视频方面的能力。简单来说，ChronoMagic-Bench就像是一个考试，它 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠提升观众观看体验！自动足球比赛解说生成模型MatchTime

AI

推荐人：暴走AI 标签：MatchTime AI

2年前 (2024-06-29)AI

上海交通大学和上海人工智能实验室的研究人员推出自动足球比赛解说生成模型MatchTime，目的是提升观众观看体验。足球作为全球最受欢迎的运动之一，拥有超过35亿的观众。精彩的解说能够为观众提供背景信息、分析和情 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Math-LLaVA：提升大语言模型在处理多模态数学问题上的能力

$Math-LLaVA：提升大语言模型在处理多模态数学问题上的能力$

AI

推荐人：暴走AI 标签：Math-LLaVA AI

2年前 (2024-06-29)AI

中国电子科技大学、新加坡科技设计大学、同济大学和新加坡国立大学的研究人员推出Math-LLaVA，提升大语言模型（LLMs）在处理多模态数学问题上的能力。多模态数学问题是指那些需要结合图像和文本信息来解决的数学问题 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠数据集EHRCon：专门设计用来确保EHRs中的结构化表格和非结构化笔记之间的数据一致性

AI

推荐人：暴走AI 标签：EHRCon AI

2年前 (2024-06-29)AI

韩国科学技术院、三星医疗中心、麻省理工学院和多伦多大学推出EHRCon，关于电子健康记录（Electronic Health Records，简称EHRs）的数据一致性问题。EHRs是医院用来存储患者医疗记录的数字系统，其中既包括结构化数 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠评估套件CharXiv：旨在更真实地测试多模态大语言模型在理解图表方面的性能

AI

推荐人：暴走AI 标签：CharXiv AI

2年前 (2024-06-29)AI

普林斯顿大学、威斯康星大学麦迪逊分校和香港大学的研究人员推出评估套件CharXiv，它旨在更真实地测试多模态大语言模型（MLLMs）在理解图表方面的性能。在现实世界的任务中，比如分析科学论文或财务报告，理解图表是 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 nexa4ai推出新型AI规划代理Octo-planner：为了在边缘设备上实现高效决策和问题解决而设计

AI

推荐人：暴走AI 标签：Octo-planner AI

2年前 (2024-06-29)AI

nexa4ai推出新型AI规划代理Octo-planner，它是为了在边缘设备上实现高效决策和问题解决而设计的。你可以将Octo-planner想象成一个智能助手，它可以在你的智能手机或其他设备上运行，帮助完成复杂的任务。例如，你要 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型优化器Adam-mini：可以将优化器想象成一位老师，它指导模型在大量数据中找到正确的答案

AI

推荐人：暴走AI 标签：Adam-mini 新型优化器 AI

2年前 (2024-06-29)AI

香港中文大学、深圳大数据研究院、杜克大学和斯坦福大学的研究人员推出新型优化器Adam-mini，在机器学习和人工智能领域，优化器是一种帮助模型在学习过程中找到最佳参数的算法。你可以将优化器想象成一位老师，它指 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠自动化框架WILDTEAMING：专门用来挖掘和测试大语言模型的安全性漏洞

AI

推荐人：暴走AI 标签：WILDTEAMING 大语言模型 AI

2年前 (2024-06-29)AI

华盛顿大学、艾伦人工智能研究所、首尔国立大学和卡内基梅隆大学推出自动化框架WILDTEAMING，它专门用来挖掘和测试大语言模型（LLMs）的安全性漏洞。简单来说，WILDTEAMING能够自动从真实的用户-聊天机器人交互中发 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型大语言模型基准测试工具LiveBench：克服现有基准测试中常见的问题，如测试数据集污染（即新模型训练时不小心包含了测试集中的数据）以及评判过程中的偏见和错误

AI

推荐人：暴走AI 标签：LiveBench AI

2年前 (2024-06-29)AI

Abacus.AI推出新型大语言模型基准测试工具LiveBench，它旨在克服现有基准测试中常见的问题，如测试数据集污染（即新模型训练时不小心包含了测试集中的数据）以及评判过程中的偏见和错误。简而言之，LiveBench是一个 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 ResumeAtlas：使用人工智能技术来提高简历分类的效率和准确性

AI

推荐人：暴走AI 标签：ResumeAtlas AI

2年前 (2024-06-29)AI

这篇论文的主题是关于如何使用人工智能技术来提高简历分类的效率和准确性。在这个数字化和网络化的时代，在线招聘变得越来越普遍，而简历分类是招聘过程中的一个重要环节。例如，一个大型公司发布了一个职位，可能会 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠数据集大小恢复DSiRe：从模型的权重中直接确定训练模型时使用的样本数量

AI

推荐人：暴走AI 标签：DSiRe AI

2年前 (2024-06-29)AI

耶路撒冷希伯来大学的研究人员推出DSiRe（数据集大小恢复，Dataset Size Recovery），旨在从模型的权重中直接确定训练模型时使用的样本数量。具体来说，研究者们专注于在使用低秩适应（LoRA）微调模型的情况下，恢复 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新技术框架DPA-RAG：解决大语言模型在进行检索增强型生成任务时面临的知识偏好不一致问题

AI

推荐人：暴走AI 标签：DPA-RAG AI

2年前 (2024-06-29)AI

中国人民大学高岭人工智能学院和北京邮电大学人工智能学院的研究人员推出新技术框架DPA-RAG（Dual Preference Alignment for Retrieval-Augmented Generation），旨在解决大语言模型（LLMs）在进行检索增强型生成任 ...... 阅读全文

直达链接好 1 不好 0 已关闭评论

推荐类别

栏目分类

AI

优惠新型文本到视频生成基准测试ChronoMagic-Bench

优惠提升观众观看体验！自动足球比赛解说生成模型MatchTime

优惠 Math-LLaVA：提升大语言模型在处理多模态数学问题上的能力

优惠数据集EHRCon：专门设计用来确保EHRs中的结构化表格和非结构化笔记之间的数据一致性

优惠评估套件CharXiv：旨在更真实地测试多模态大语言模型在理解图表方面的性能

优惠 nexa4ai推出新型AI规划代理Octo-planner：为了在边缘设备上实现高效决策和问题解决而设计

优惠新型优化器Adam-mini：可以将优化器想象成一位老师，它指导模型在大量数据中找到正确的答案

优惠自动化框架WILDTEAMING：专门用来挖掘和测试大语言模型的安全性漏洞

优惠新型大语言模型基准测试工具LiveBench：克服现有基准测试中常见的问题，如测试数据集污染（即新模型训练时不小心包含了测试集中的数据）以及评判过程中的偏见和错误

优惠 ResumeAtlas：使用人工智能技术来提高简历分类的效率和准确性

优惠数据集大小恢复DSiRe：从模型的权重中直接确定训练模型时使用的样本数量

优惠新技术框架DPA-RAG：解决大语言模型在进行检索增强型生成任务时面临的知识偏好不一致问题