推荐类别

栏目分类

优惠 如何通过强化学习来提升大语言模型的推理能力

  • 如何通过强化学习来提升大语言模型的推理能力
    AI
  • 这篇论文探讨了如何通过强化学习(Reinforcement Learning, RL)来提升大语言模型(Large Language Models, LLMs)的推理能力。研究者们尝试了多种RL算法,包括专家迭代(Expert Iteration, EI)、近端策略优化(Proximal Policy Optimiza... 阅读全文

    优惠 中等规模的通用语言模型(如LLaMA-2 7B)在数学问题解决方面也表现出了强大的能力

  • 中等规模的通用语言模型(如LLaMA-2 7B)在数学问题解决方面也表现出了强大的能力
    AI
  • 这篇论文探讨了即使是中等规模的通用语言模型(如LLaMA-2 7B)在数学问题解决方面也表现出了强大的能力。研究者们发现,尽管这些模型在随机生成答案时准确率不高,但通过从256个随机生成的答案中选择最佳答案,它们在GSM8K和MATH这两个数学基准测试上的准确率分别达到了97.7%和72.0%。这表明,这些模型已经具备... 阅读全文

    优惠 Backtracing:从文本中追溯并找到最有可能引发特定查询(如问题或评论)的那部分内容

  • Backtracing:从文本中追溯并找到最有可能引发特定查询(如问题或评论)的那部分内容
    AI
  • 斯坦福大学研究团队推出Backtracing,它的目标是从文本中追溯并找到最有可能引发特定查询(如问题或评论)的那部分内容。想象一下,你是一位讲师,你的学生在听完你的讲座后提出了一些问题。你想知道他们为什么会提出这些问题,以便改进你的教学内容。Backtracing就是帮助你找到学生问题背后的具体原因。 GitHub:... 阅读全文

    优惠 大模型斗兽场Chatbot Arena:开放的、基于人类偏好来评估大语言模型的工具

  • 大模型斗兽场Chatbot Arena:开放的、基于人类偏好来评估大语言模型的工具
    AI
  • 这篇论文介绍了一个名为Chatbot Arena的平台,这是一个开放的、基于人类偏好来评估大语言模型(LLMs)的工具。想象一下,你有两个聊天机器人,你给它们各自提出问题,然后选择哪个回答得更好。Chatbot Arena就是这样一个平台,它通过让人们在两个AI模型之间进行选择,来评估这些模型的性能。 项目主页:htt... 阅读全文

    优惠 通过分类方法来训练价值函数,以提高深度强化学习的可扩展性和性能

  • 通过分类方法来训练价值函数,以提高深度强化学习的可扩展性和性能
    AI
  • 这篇论文的主题是关于如何通过分类方法来训练价值函数,以提高深度强化学习(Deep Reinforcement Learning, RL)的可扩展性和性能。在深度强化学习中,价值函数是一个核心组件,它通常由神经网络参数化,并通过最小化均方误差(Mean Squared Error, MSE)来匹配引导目标值。然而,将这种... 阅读全文

    优惠 为GPT4Free项目提供UI界面:FreeGPT WebUI v2

  • 为GPT4Free项目提供UI界面:FreeGPT WebUI v2
    AI
  • GPT4Free是一个由开发者Xtekky在GitHub上发布的开源项目,它可以免费地使用GPT-3.5、GPT-4、llama、gemini-pro、bard、claude等多种大模型,不过GPT4Free使用起来比较麻烦。今天为大家介绍的FreeGPT WebUI v2是一个GPT4Free的UI界面,让大家可以更... 阅读全文

    优惠 fal.ai:提供AI模型服务的云端 API 平台

  • fal.ai:提供AI模型服务的云端 API 平台
    AI
  • fal.ai是一个可以提供AI模型服务的云端 API 平台,提供了 Stable Diffusion相关模型、Whisper、AnimateDiff等,你可以通过API的方式搭建网站或者在本地运行这些模型,无需购买显卡,大家可以看看! 官网地址:https://fal.ai/ 开源程序:https://github.c... 阅读全文

    优惠 基于SD模型的AI绘画网站Distillery,支持训练自己专属Lora模型

  • 基于SD模型的AI绘画网站Distillery,支持训练自己专属Lora模型
    AI
  • Distillery是一个基于Stable Diffusion模型的AI图像生成器,目前架设在Discord上,他们有自己训练的模型,支持多种模式,如文生图、图生图、还可以训练自己专属的Lora模型。官方还提供了详细的教程,大家可以根据教程使用该服务。... 阅读全文

    优惠 Adobe发布了新版Adobe Express移动应用,借助生成式 AI 快速创建内容

  • Adobe发布了新版Adobe Express移动应用,借助生成式 AI 快速创建内容
    工具
  • Adobe发布了新版Adobe Express移动应用,该应用现处于Android和iOS系统的测试阶段。此次升级不仅带来了颠覆性的Adobe Firefly生成式AI技术和全新的移动编辑功能,还进一步提升了用户体验,让创意想法更快速地转化为吸睛内容。该应用集成了Adobe数十年的图像、视频和设计技术积淀,结合Fire... 阅读全文

    优惠 线上P2P文件传输服务「PairDrop」:跨平台、跨网络、不限文件大小

  • 线上P2P文件传输服务「PairDrop」:跨平台、跨网络、不限文件大小
    工具
  • 「PairDrop」是一款免费的线上P2P文件传输服务,同时也是一个开源软件。它基于ShareDrop发展而来,因此界面和操作方式相似。但「PairDrop」在装置连结方面更具弹性。传统的文件传输往往要求设备处于相同的网络环境,而「PairDrop」通过输入代码、扫描二维码或输入公共房间代码等多种模式,实现了更便捷的传... 阅读全文

    优惠 Chrome扩展程序Mellow:批量保存 DALL-E 生成的图片与提示词

  • Chrome扩展程序Mellow:批量保存 DALL-E 生成的图片与提示词
    AI
  • Mellow是专为在GPTs或DALL·E中生成AI图像的ChatGPT用户设计的一款实用Chrome扩展程序。它旨在简化工作流程,让用户能够轻松高效地管理和归档由这些强大工具创建的视觉内容。使用Mellow,您只需轻点鼠标,即可将生成的图像以及相关的提示信息无缝保存至Fibery等第三方应用程序中,同时也支持一键生成... 阅读全文

    优惠 Inflection发布全新模型:Inflection-2.5,已经正式向 Pi 用户全面开放

  • Inflection发布全新模型:Inflection-2.5,已经正式向 Pi 用户全面开放
    AI
  • 📢 Inflection发布全新模型:Inflection-2.5,已经正式向 Pi 用户全面开放,它以更低的训练成本实现了接近 GPT-4 的卓越性能——仅消耗了后者 40% 的计算资源进行训练。🚀 💡在编码、数学等高智商领域,Inflection-2.5 实现了显著跃升,展现更强实力! 📰Pi 现已集成实时网络搜索... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?