大语言模型

优惠 MedFuzz:大语言模型在医学问题回答中的鲁棒性

  • MedFuzz:大语言模型在医学问题回答中的鲁棒性
    AI
  • 微软发布论文,论文的主题是探讨大语言模型(LLMs)在医学问题回答中的鲁棒性,即这些模型在面对现实世界临床环境时,其性能是否能够稳定地泛化。论文的核心观点是,尽管LLMs在医学问题回答的基准测试中表现出色,但 ...... 阅读全文

    优惠 提升大语言模型在数学推理方面的表现

  • 提升大语言模型在数学推理方面的表现
    AI
  • 谷歌发布论文,论文的主题是提升大语言模型(LLMs)在数学推理方面的表现。例如,你有一个大型语言模型助手,你问它“一个篮子里有5个苹果,我拿走了2个,篮子里还有几个?”一个普通的助手可能会简单地回答“3个”。但 ...... 阅读全文

    优惠 简单高效的掩蔽扩散语言模型MDLM:生成文本方面表现出色,特别是在与自回归(AR)方法相比时,显示出了更好的性能

  • 简单高效的掩蔽扩散语言模型MDLM:生成文本方面表现出色,特别是在与自回归(AR)方法相比时,显示出了更好的性能
    AI
  • 康乃尔科技校区推出一种新型的语言模型MDLM(简单高效的掩蔽扩散语言模型)。这种模型在生成文本方面表现出色,特别是在与自回归(AR)方法相比时,显示出了更好的性能。通过对比实验展示了MDLM在多个语言模型基准测 ...... 阅读全文

    优惠 Skywork-MoE:具有1460亿参数和16个专家的高性能混合专家模型

  • Skywork-MoE:具有1460亿参数和16个专家的高性能混合专家模型
    AI
  • 昆仑万维旗下天工AI发布大语言模型(LLM)训练技术Skywork-MoE,Skywork-MoE是一个具有1460亿参数和16个专家的高性能混合专家(Mixture-of-Experts,简称MoE)模型。这个模型是从Skywork-13B模型的密集型检查点初始 ...... 阅读全文

    优惠 “提示技术(Prompting Techniques)”在生成式AI系统中的应用和研究

  • “提示技术(Prompting Techniques)”在生成式AI系统中的应用和研究
    AI
  • 来自微软和OpenAI领衔多所大学的研究人员发布论文,论文的主题是关于“提示技术”(Prompting Techniques)在生成式AI(Generative AI,简称GenAI)系统中的应用和研究。简单来说,提示技术是一种与人工智能系统交流的 ...... 阅读全文

    优惠 MCTSr算法:将大语言模型与蒙特卡洛树搜索(MCTS)结合起来的创新方法

  • MCTSr算法:将大语言模型与蒙特卡洛树搜索(MCTS)结合起来的创新方法
    AI
  • 复旦大学和上海AI实验室发布MCT Self-Refine(MCTSr)算法,它是一种将大语言模型(LLMs)与蒙特卡洛树搜索(MCTS)结合起来的创新方法,旨在提高解决复杂数学问题的性能。这种方法特别针对大型语言模型在策略性思维 ...... 阅读全文

    优惠 综合数据集GUI Odyssey:训练和评估跨应用(Cross-App)图形用户界面(GUI)导航代理

  • 综合数据集GUI Odyssey:训练和评估跨应用(Cross-App)图形用户界面(GUI)导航代理
    AI
  • 上海人工智能实验室OpenGVLab、香港大学、南京大学、哈尔滨工业大学和上海交通大学的研究人员推出综合数据集GUI Odyssey,它旨在训练和评估跨应用(Cross-App)图形用户界面(GUI)导航代理。这些代理能够模拟用户与 ...... 阅读全文

    优惠 T2VHE协议:提高文生视频模型评估的可靠性、可重复性和实用性

  • T2VHE协议:提高文生视频模型评估的可靠性、可重复性和实用性
    AI
  • 上海人工智能实验室、新加坡国立大学、香港大学、威斯康星大学麦迪逊分校和加州大学圣地亚哥分校的研究人员推出T2VHE协议,重新思考文本到视频(Text-to-Video,简称T2V)模型的人类评估协议,目的是提高评估的可靠 ...... 阅读全文

    优惠 TalkTuner:用于提高对话式AI透明度和控制性的仪表板

  • TalkTuner:用于提高对话式AI透明度和控制性的仪表板
    AI
  • 哈佛大学和Google 研究的研究人员推出 TalkTuner ,这是一个用于提高对话式人工智能(AI)透明度和控制性的仪表板(Dashboard)。这个仪表板的目的是让用户能够理解并控制AI聊天机器人的内部工作机制,特别是它如何 ...... 阅读全文

    优惠 新基准测试ChartMimic:专门用来评估大型多模态模型(LMMs)在将图表转换为代码方面的能力

  • 新基准测试ChartMimic:专门用来评估大型多模态模型(LMMs)在将图表转换为代码方面的能力
    AI
  • 清华大学、 香港中文大学、早稻田大学和腾讯人工智能实验室发布新基准测试ChartMimic,它专门用来评估大型多模态模型(LMMs)在将图表转换为代码方面的能力。你是一位物理学家,你有一个关于粒子速度分布的复杂图表 ...... 阅读全文

    优惠 AIRI推出一种新型的大型多任务强化学习数据集XLand-100B

  • AIRI推出一种新型的大型多任务强化学习数据集XLand-100B
    AI
  • AIRI推出一种新型的大型多任务强化学习数据集——XLand-100B。想象一下,你是一个拥有超能力的机器人,能够通过观察别人玩游戏来学习如何自己玩游戏,而且不需要别人告诉你每一步怎么走,你只需要看他们玩几次就能自己 ...... 阅读全文

    优惠 MaskLID:用于识别在一段话中混合使用的不同语言

  • MaskLID:用于识别在一段话中混合使用的不同语言
    AI
  • 慕尼黑大学和慕尼黑机器学习中心、索邦大学和法国国家科学研究院的研究人员推出MaskLID,它用于识别在一段话中混合使用的不同语言,也就是所谓的“代码切换”(Code-Switching,简称CS)。代码切换是指在一段话中交替 ...... 阅读全文