优惠用于压缩大语言模型提示词的新方法LLMLingua-2

AI

推荐人：暴走AI 标签：LLMLingua-2 AI

2年前 (2024-03-20)AI

来自清华和微软的研究团队推出LLMLingua-2，它是一种用于压缩大语言模型（LLMs）提示词（prompts）的新方法，目的是在不丢失关键信息的同时提高效率和泛化能力。在大语言模型的使用中，提示词通常是一段文本，用来引 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 AI/ML API：1个API连接100+ AI模型

AI

推荐人：暴走AI 标签：AI/ML API AI模型 AI

2年前 (2024-03-20)AI

AI/ML API为开发者提供通过单一API访问超过100个AI模型的机会，确保全天候创新。以比GPT-4低80%的成本提供同等性能，并具备与OpenAI的无缝兼容性，实现轻松过渡。 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠马斯克旗下 xAI正式开源了Grok-1模型

AI

推荐人：暴走AI 标签：Grok-1 混合专家模型 AI

2年前 (2024-03-17)AI

马斯克旗下 xAI正式开源了Grok-1模型，这是一个拥有3140亿参数的混合专家（Mixture-of-Experts）模型，由xAI团队从零开始训练。不过需要注意的是此模型尚未针对任何特定应用（如对话系统）进行微调，依据Apache 2.0 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠谷歌开源模型Gemini的技术论文

AI

推荐人：暴走AI 标签：Gemini 谷歌 AI

2年前 (2024-03-15)AI

谷歌发布的Gemma技术论文，这是一系列基于Google的Gemini模型研究和技术构建的轻量级、最先进的开源模型。Gemma模型在语言理解、推理和安全性方面的学术基准测试中表现出色。论文发布了两个规模的模型（20亿和70亿参 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 SOTOPIA-π：如何通过交互式学习方法提升语言代理（即人工智能聊天机器人）的社会智能

AI

推荐人：暴走AI 标签：SOTOPIA-π AI

2年前 (2024-03-15)AI

来自语言技术学院和卡内基·梅隆大学的研究团队发布论文探讨如何通过交互式学习方法提升语言代理（即人工智能聊天机器人）的社会智能。社会智能是指理解和处理社会互动的能力，这对于创建能够与人类自然交流的虚拟助 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠开放基础模型（Open Foundation Models）对社会的影响

AI

推荐人：暴走AI 标签：开源模型 AI

2年前 (2024-03-15)AI

这篇论文的主题是探讨开放基础模型（Open Foundation Models）对社会的影响。基础模型是一种强大的人工智能技术，它们在现代AI生态系统中扮演着核心角色，推动了技术的快速发展、部署和应用。开放基础模型特指那些模 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠大语言模型（LLMs）的持续预训练策略

AI

推荐人：暴走AI 标签：大语言模型 AI

2年前 (2024-03-15)AI

这篇论文探讨了大语言模型（LLMs）的持续预训练策略。大语言模型是人工智能领域的一个重要组成部分，它们通过学习大量文本数据来理解和生成人类语言。例如，当你使用智能助手或搜索引擎时，背后的技术可能就是一个语 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠在训练和评估语言模型时，规模法则（scaling laws）的可靠性和实用性

AI

推荐人：暴走AI 标签：规模法则 AI

2年前 (2024-03-15)AI

这篇论文探讨了在训练和评估语言模型时，规模法则（scaling laws）的可靠性和实用性。语言模型是人工智能中的一个关键组成部分，它们能够理解和生成人类语言。例如，当你使用智能助手进行对话时，背后就是一个语言模 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠苹果推出多模态大语言模型MM1

AI

推荐人：暴走AI 标签：MM1 多模态大语言模型苹果 AI

2年前 (2024-03-15)AI

苹果推出多模态大语言模型MM1，这是一个结合了图像和文本处理能力的AI模型。MM1通过在大规模的图像-文本数据上进行预训练，学会了理解和生成与图像相关的文本，例如图像描述、回答关于图像的问题等。主要功能和特点 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠多模态框架VisionGPT-3D：提升三维视觉理解的能力

AI

推荐人：暴走AI 标签：VisionGPT-3D 多模态 AI

2年前 (2024-03-15)AI

多模态框架VisionGPT-3D，它旨在提升三维视觉理解的能力。VisionGPT-3D通过整合现有的最佳视觉模型，自动化选择适合的算法，从而将二维图像转换为三维表示，这在计算机视觉领域是一个创新的尝试。主要功能和特点： ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Hugging Face推出数据集WebSight和基于视觉-语言模型的系统Sightseer：它们旨在自动化网页截图到HTML代码的转换过程

AI

推荐人：暴走AI 标签：Hugging Face Sightseer WebSight AI

2年前 (2024-03-15)AI

Hugging Face推出数据集WebSight和一个基于视觉-语言模型（VLM）的系统Sightseer，它们旨在自动化网页截图到HTML代码的转换过程。这项技术对于网页开发者来说非常有价值，因为它可以极大地提高开发效率，尤其是在无 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠视觉状态空间模型LocalMamba：为了提高计算机视觉任务的性能而设计

AI

推荐人：暴走AI 标签：LocalMamba 视觉状态空间模型 AI

2年前 (2024-03-15)AI

来自悉尼大学工程学院计算机科学学院、商汤科技研究院、中国科学技术大学的研究团队推出视觉状态空间模型（Visual State Space Model）LocalMamba，它是为了提高计算机视觉任务的性能而设计的。LocalMamba的核心思想 ...... 阅读全文

直达链接好 0 不好 0 已关闭评论

推荐类别

栏目分类

大语言模型

优惠用于压缩大语言模型提示词的新方法LLMLingua-2

优惠 AI/ML API：1个API连接100+ AI模型

优惠马斯克旗下 xAI正式开源了Grok-1模型

优惠谷歌开源模型Gemini的技术论文

优惠 SOTOPIA-π：如何通过交互式学习方法提升语言代理（即人工智能聊天机器人）的社会智能

优惠开放基础模型（Open Foundation Models）对社会的影响

优惠大语言模型（LLMs）的持续预训练策略

优惠在训练和评估语言模型时，规模法则（scaling laws）的可靠性和实用性

优惠苹果推出多模态大语言模型MM1

优惠多模态框架VisionGPT-3D：提升三维视觉理解的能力

优惠 Hugging Face推出数据集WebSight和基于视觉-语言模型的系统Sightseer：它们旨在自动化网页截图到HTML代码的转换过程

优惠视觉状态空间模型LocalMamba：为了提高计算机视觉任务的性能而设计