优惠 MedFuzz：大语言模型在医学问题回答中的鲁棒性

AI

推荐人：暴走AI 标签：MedFuzz AI

2年前 (2024-06-17)AI

微软发布论文，论文的主题是探讨大语言模型（LLMs）在医学问题回答中的鲁棒性，即这些模型在面对现实世界临床环境时，其性能是否能够稳定地泛化。论文的核心观点是，尽管LLMs在医学问题回答的基准测试中表现出色，但 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠提升大语言模型在数学推理方面的表现

AI

推荐人：暴走AI 标签：大语言模型 AI

2年前 (2024-06-17)AI

谷歌发布论文，论文的主题是提升大语言模型（LLMs）在数学推理方面的表现。例如，你有一个大型语言模型助手，你问它“一个篮子里有5个苹果，我拿走了2个，篮子里还有几个？”一个普通的助手可能会简单地回答“3个”。但 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠简单高效的掩蔽扩散语言模型MDLM：生成文本方面表现出色，特别是在与自回归（AR）方法相比时，显示出了更好的性能

AI

推荐人：暴走AI 标签：MDLM 掩蔽扩散语言模型 AI

2年前 (2024-06-17)AI

康乃尔科技校区推出一种新型的语言模型MDLM（简单高效的掩蔽扩散语言模型）。这种模型在生成文本方面表现出色，特别是在与自回归（AR）方法相比时，显示出了更好的性能。通过对比实验展示了MDLM在多个语言模型基准测 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Skywork-MoE：具有1460亿参数和16个专家的高性能混合专家模型

AI

推荐人：暴走AI 标签：Skywork-MoE 混合专家模型 AI

2年前 (2024-06-17)AI

昆仑万维旗下天工AI发布大语言模型（LLM）训练技术Skywork-MoE，Skywork-MoE是一个具有1460亿参数和16个专家的高性能混合专家（Mixture-of-Experts，简称MoE）模型。这个模型是从Skywork-13B模型的密集型检查点初始 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 “提示技术（Prompting Techniques）”在生成式AI系统中的应用和研究

AI

推荐人：暴走AI 标签：Prompting Techniques 提示技术 AI

2年前 (2024-06-17)AI

来自微软和OpenAI领衔多所大学的研究人员发布论文，论文的主题是关于“提示技术”（Prompting Techniques）在生成式AI（Generative AI，简称GenAI）系统中的应用和研究。简单来说，提示技术是一种与人工智能系统交流的 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MCTSr算法：将大语言模型与蒙特卡洛树搜索（MCTS）结合起来的创新方法

AI

推荐人：暴走AI 标签：MCTSr AI

2年前 (2024-06-17)AI

复旦大学和上海AI实验室发布MCT Self-Refine（MCTSr）算法，它是一种将大语言模型（LLMs）与蒙特卡洛树搜索（MCTS）结合起来的创新方法，旨在提高解决复杂数学问题的性能。这种方法特别针对大型语言模型在策略性思维 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠综合数据集GUI Odyssey：训练和评估跨应用（Cross-App）图形用户界面（GUI）导航代理

AI

推荐人：暴走AI 标签：GUI Odyssey 数据集 AI

2年前 (2024-06-17)AI

上海人工智能实验室OpenGVLab、香港大学、南京大学、哈尔滨工业大学和上海交通大学的研究人员推出综合数据集GUI Odyssey，它旨在训练和评估跨应用（Cross-App）图形用户界面（GUI）导航代理。这些代理能够模拟用户与 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 T2VHE协议：提高文生视频模型评估的可靠性、可重复性和实用性

AI

推荐人：暴走AI 标签：T2VHE AI

2年前 (2024-06-17)AI

上海人工智能实验室、新加坡国立大学、香港大学、威斯康星大学麦迪逊分校和加州大学圣地亚哥分校的研究人员推出T2VHE协议，重新思考文本到视频（Text-to-Video，简称T2V）模型的人类评估协议，目的是提高评估的可靠 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 TalkTuner：用于提高对话式AI透明度和控制性的仪表板

AI

推荐人：暴走AI 标签：TalkTuner AI

2年前 (2024-06-17)AI

哈佛大学和Google 研究的研究人员推出 TalkTuner ，这是一个用于提高对话式人工智能（AI）透明度和控制性的仪表板（Dashboard）。这个仪表板的目的是让用户能够理解并控制AI聊天机器人的内部工作机制，特别是它如何 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新基准测试ChartMimic：专门用来评估大型多模态模型（LMMs）在将图表转换为代码方面的能力

AI

推荐人：暴走AI 标签：ChartMimic AI

2年前 (2024-06-17)AI

清华大学、香港中文大学、早稻田大学和腾讯人工智能实验室发布新基准测试ChartMimic，它专门用来评估大型多模态模型（LMMs）在将图表转换为代码方面的能力。你是一位物理学家，你有一个关于粒子速度分布的复杂图表 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 AIRI推出一种新型的大型多任务强化学习数据集XLand-100B

AI

推荐人：暴走AI 标签：XLand-100B AI

2年前 (2024-06-17)AI

AIRI推出一种新型的大型多任务强化学习数据集——XLand-100B。想象一下，你是一个拥有超能力的机器人，能够通过观察别人玩游戏来学习如何自己玩游戏，而且不需要别人告诉你每一步怎么走，你只需要看他们玩几次就能自己 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 MaskLID：用于识别在一段话中混合使用的不同语言

AI

推荐人：暴走AI 标签：MaskLID 代码切换 AI

2年前 (2024-06-17)AI

慕尼黑大学和慕尼黑机器学习中心、索邦大学和法国国家科学研究院的研究人员推出MaskLID，它用于识别在一段话中混合使用的不同语言，也就是所谓的“代码切换”（Code-Switching，简称CS）。代码切换是指在一段话中交替 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

推荐类别

栏目分类

大语言模型

优惠 MedFuzz：大语言模型在医学问题回答中的鲁棒性

优惠提升大语言模型在数学推理方面的表现

优惠简单高效的掩蔽扩散语言模型MDLM：生成文本方面表现出色，特别是在与自回归（AR）方法相比时，显示出了更好的性能

优惠 Skywork-MoE：具有1460亿参数和16个专家的高性能混合专家模型

优惠 “提示技术（Prompting Techniques）”在生成式AI系统中的应用和研究

优惠 MCTSr算法：将大语言模型与蒙特卡洛树搜索（MCTS）结合起来的创新方法

优惠综合数据集GUI Odyssey：训练和评估跨应用（Cross-App）图形用户界面（GUI）导航代理

优惠 T2VHE协议：提高文生视频模型评估的可靠性、可重复性和实用性

优惠 TalkTuner：用于提高对话式AI透明度和控制性的仪表板

优惠新基准测试ChartMimic：专门用来评估大型多模态模型（LMMs）在将图表转换为代码方面的能力

优惠 AIRI推出一种新型的大型多任务强化学习数据集XLand-100B

优惠 MaskLID：用于识别在一段话中混合使用的不同语言