推荐类别

栏目分类

优惠 360 智脑 7B 参数大模型开源,支持 50 万字长文本输入

  • 360 智脑 7B 参数大模型开源,支持 50 万字长文本输入
    AI
  • 360 公司日前在 GitHub 上开源了 360 智脑 7B(70 亿参数模型)。360 智脑大模型采用 3.4 万亿 Tokens 的语料库训练,以中文、英文、代码为主,开放 4K、32K、360K 三种不同文本长度。360 表示,360K(约 50 万字)是当前国产开源模型文本长度最长的。 GitHub:http... 阅读全文

    优惠 Chrome插件Just-One-Page-PDF :将网页保存为 A4 尺寸的 PDF

  • Chrome插件Just-One-Page-PDF :将网页保存为 A4 尺寸的 PDF
    工具
  • Just-One-Page-PDF 是一款 Chrome 扩展,用来将网页保存为 A4 尺寸的 PDF,可以是完整的一页,也可以是多页。用起来,就像截图一样。@Appinn 特征 整个网页的一页PDF 整个网页的多页PDF 支持自定义纸张尺寸,例如。窗口尺寸,A4、A3、Letter 等。 截图,但是PDF格式。 一次... 阅读全文

    优惠 FootageCrate:自媒体创作者的素材宝库,海量资源免费下载

  • FootageCrate:自媒体创作者的素材宝库,海量资源免费下载
    工具
  • 自媒体创作者们,还在为寻找合适的视频素材而苦恼吗?现在,有了FootageCrate,你的创作之路将变得更加轻松和丰富!FootageCrate为自媒体创作者提供了数以千计的视频创作资源,包括视觉特效、动作元素,还有音乐音效、图形、3D、AR等素材。无论你需要什么类型的素材,都能在这里轻松找到。使用者只需利用分类或搜索... 阅读全文

    优惠 IPCheck.ing:一站式免费IP工具箱,功能全面且强大

  • IPCheck.ing:一站式免费IP工具箱,功能全面且强大
    工具
  • 对于经常需要查询IP信息、测试网络连通性的朋友来说,IPCheck.ing是一个不可多得的好帮手。这个多合一的IP工具箱整合了多种功能,旨在为用户提供便捷、高效的查询和测试服务。IPCheck.ing不仅可以帮助你轻松查询自己的IP资讯,还整合了网络连通性测试、WebRTC测试、DNS泄漏测试、分流测试、网络速度测试、... 阅读全文

    优惠 大型预训练语言模型(如Llama2、GPT-4、Claude 3等)在没有经过额外训练或梯度更新的情况下,仅通过上下文示例进行线性和非线性回归任务的能力

  • 大型预训练语言模型(如Llama2、GPT-4、Claude 3等)在没有经过额外训练或梯度更新的情况下,仅通过上下文示例进行线性和非线性回归任务的能力
    AI
  • 来自亚利桑那大学和克卢日·纳波卡技术大学的研究人员发布论文探讨了大型预训练语言模型(如Llama2、GPT-4、Claude 3等)在没有经过额外训练或梯度更新的情况下,仅通过上下文示例进行线性和非线性回归任务的能力。简单来说,就是研究这些智能模型是否能通过观察一些例子,就能学会预测或估计某些数值。 例如,假设我们有一... 阅读全文

    优惠 大语言模型JetMoE-8B:通过创新的技术实现了低成本和高性能的平衡,为各种语言处理任务提供了广泛的应用可能性

  • 大语言模型JetMoE-8B:通过创新的技术实现了低成本和高性能的平衡,为各种语言处理任务提供了广泛的应用可能性
    AI
  • 来自MIT的研究人员推出新型大语言模型JetMoE-8B,它通过创新的技术实现了低成本和高性能的平衡,为各种语言处理任务提供了广泛的应用可能性。例如,你有一个超级聪明的机器人朋友,它可以和你聊天、帮你写代码、解答数学问题,甚至还能理解和生成不同语言的文本,这就是JetMoE-8B的超能力。 项目主页:https://r... 阅读全文

    优惠 英伟达推出数据据Audio Dialogues:提升音频和音乐理解方面的对话能力

  • 英伟达推出数据据Audio Dialogues:提升音频和音乐理解方面的对话能力
    AI
  • 英伟达推出数据据Audio Dialogues,旨在提升音频和音乐理解方面的对话能力。现有的音频理解数据集主要集中在单轮交互上,例如音频描述或音频问答,这些数据集限制了通过交互式对话理解音频的能力。Audio Dialogues是一个多轮对话数据集,包含了16.38万个样本,涵盖一般声音和音乐。除了对话样本,该数据集还... 阅读全文

    优惠 谷歌推出新型开放语言模型RecurrentGemma

  • 谷歌推出新型开放语言模型RecurrentGemma
    AI
  • 谷歌推出新型开放语言模型RecurrentGemma,它使用了谷歌的Griffin架构。Griffin架构通过结合线性递归和局部注意力机制,在处理语言任务时表现出色。RecurrentGemma模型的一个显著特点是它具有固定大小的状态,这减少了内存使用,使得在长序列上进行高效推理成为可能。研究者们提供了一个预训练模型,... 阅读全文

    优惠 语言模型RHO-1:挑战了传统的语言模型训练方法,设计理念是“并非所有的词汇对于语言模型训练都同等重要”

  • 语言模型RHO-1:挑战了传统的语言模型训练方法,设计理念是“并非所有的词汇对于语言模型训练都同等重要”
    AI
  • 来自厦门大学、清华大学和微软的研究人员推出语言模型RHO-1,它的设计理念是“并非所有的词汇对于语言模型训练都同等重要”。RHO-1挑战了传统的语言模型训练方法,后者通常会对所有训练词汇应用相同的预测下一个词汇的损失函数。通过对语言模型训练过程中的词汇级别动态进行初步分析,研究者们发现不同的词汇在训练中表现出不同的损失... 阅读全文

    优惠 多模态大语言模型Ferret-v2:专门设计用于提升图像理解和自然语言处理的能力

  • 多模态大语言模型Ferret-v2:专门设计用于提升图像理解和自然语言处理的能力
    AI
  • 苹果推出一个升级版的多模态大语言模型Ferret-v2,专门设计用于提升图像理解和自然语言处理的能力。例如,你有一个智能助手,它不仅能理解你说的话,还能看懂图片里的内容,并根据图片和你的问题给出精确的回答。Ferret-v2就是这样一个系统,它能够识别和描述图片中的物体,理解图片中的细节,并根据这些信息回答有关图片的问... 阅读全文

    优惠 用于测试和开发多模态智能体的基准平台OSWORLD

  • 用于测试和开发多模态智能体的基准平台OSWORLD
    AI
  • 来自香港大学、Salesforce Research、卡内基梅隆大学和滑铁卢大学的研究人员推出OSWORLD,它是一个用于测试和开发多模态智能体的基准平台。这些智能体是指能够通过自然语言指令和图形界面与计算机系统交互的人工智能程序。例如,你有一个虚拟助手,它可以帮你完成电脑上的各种任务,比如编辑文档、浏览网页、管理电子... 阅读全文

    优惠 LLoCO:旨在解决大语言模型处理长文本时遇到的挑战

  • LLoCO:旨在解决大语言模型处理长文本时遇到的挑战
    AI
  • 加州大学伯克利分校的研究人员推出新技术LLoCO(Learning Long Contexts Offline),旨在解决大语言模型(LLMs)处理长文本时遇到的挑战。由于自注意力机制的计算和内存开销随序列长度增加而呈二次方增长,以及生成过程中庞大的键值(KV)缓存大小,处理长文本对LLMs来说一直是个难题。 主要功能... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?