推荐类别

栏目分类

优惠 基于扩散的文生图模型的可扩展性

  • 基于扩散的文生图模型的可扩展性
    AI
  • 亚马逊AWS发布论文探讨了基于扩散的文本到图像生成(Text-to-Image, T2I)模型的可扩展性。扩散模型是一种通过逐步去噪来生成图像的深度学习技术。论文的主要目的是理解如何有效地扩展这些模型以提高性能,同时降低成本。 主要功能和特点: 模型和数据集的扩展性研究:论文通过大量实验研究了扩展模型和数据集对性能的影... 阅读全文

    优惠 谷歌推出新型的基于Transformer的语言模型“Mixture-of-Depths(MoD)”

  • 谷歌推出新型的基于Transformer的语言模型“Mixture-of-Depths(MoD)”
    AI
  • 谷歌推出新型的基于Transformer的语言模型“Mixture-of-Depths”(MoD),它能够动态地在模型的不同层之间分配计算资源。传统的变换器模型在处理输入序列时,对每个标记(token)都均匀地分配计算资源。然而,并非所有的标记都需要相同的计算量来准确预测结果。MoD模型通过学习动态地决定哪些标记需要更... 阅读全文

    优惠 新型框架THINK-AND-EXECUTE:旨在提高大语言模型在算法推理任务上的表现

  • 新型框架THINK-AND-EXECUTE:旨在提高大语言模型在算法推理任务上的表现
    AI
  • 来自韩国的研究人员推出新型框架THINK-AND-EXECUTE,旨在提高大语言模型(LLMs)在算法推理任务上的表现。算法推理是指理解问题背后的复杂模式,并将其分解为一系列推理步骤以找到解决方案的能力。这种能力对于语言模型来说是一个挑战,因为它们需要将复杂的推理模式转化为一系列详细的步骤。总的来说,THINK-AND... 阅读全文

    优惠 智谱AI推出ChatGLM-Math:提升大语言模型在解决数学问题方面的能力

  • 智谱AI推出ChatGLM-Math:提升大语言模型在解决数学问题方面的能力
    AI
  • 智谱AI推出ChatGLM-Math,提升大语言模型(LLMs)在解决数学问题方面的能力。想象一下,你有一个超级聪明的机器人助手,它可以和人类一样理解和使用语言,但是当你给它一些数学题目时,它却常常束手无策或者给出错误的答案。这篇论文就是想解决这个问题,让机器人助手不仅能聊天,还能帮你解决数学题。这项研究的目标是让语言... 阅读全文

    优惠 元象首个MoE大模型XVERSE-MoE-A4.2B开源:4.2B激活参数,效果堪比13B模型

  • 元象首个MoE大模型XVERSE-MoE-A4.2B开源:4.2B激活参数,效果堪比13B模型
    AI
  • 元象发布XVERSE-MoE-A4.2B大模型 ,采用业界最前沿的混合专家模型架构,激活参数4.2B,效果即可达到13B模型水准。据介绍,XVERSE-MoE-A4.2B实现了极致压缩,相比XVERSE-13B-2仅用30%计算量,并减少50%训练时间。在多个权威评测中,元象MoE效果大幅超越Gemma-7B、Mist... 阅读全文

    优惠 普林斯顿团队发布开源版AI程序员SWE-agent

  • 普林斯顿团队发布开源版AI程序员SWE-agent
    AI
  • 普林斯顿团队开源发布了Agent打造的AI程序员SWE-agent,它能让GPT-4等大模型轻松编辑和运行代码,在SWE-bench测试集上获得与首个AI程序员Devin相似的准确度,平均耗时93秒。 项目主页:https://swe-agent.com GitHub:https://github.com/prince... 阅读全文

    优惠 先进语音合成模型VOICECRAFT:在不需要任何额外文本的情况下,对语音进行编辑和合成

  • 先进语音合成模型VOICECRAFT:在不需要任何额外文本的情况下,对语音进行编辑和合成
    AI
  • 来自德克萨斯大学奥斯汀分校和Rembrand的研究团队推出先进语音合成模型VOICECRAFT,它能够在不需要任何额外文本的情况下,对语音进行编辑和合成,这被称为零样本文本到语音(TTS)任务。想象一下,你有一段录音,想要改变里面的某些词语或者语调,而不需要重新录制整个句子,VOICECRAFT就能够做到这一点。同样,... 阅读全文

    优惠 谷歌发布视频插值生成模型VIDIM

  • 谷歌发布视频插值生成模型VIDIM
    AI
  • 谷歌发布视频插值生成模型VIDIM,它能够根据给定的起始和结束帧生成中间的短视频。想象一下,你有两张图片,一张是一个人跳起来的动作,另一张是这个人落地的动作,VIDIM能够在这两张图片之间生成一系列连贯的帧,形成一个平滑的跳跃动作视频。 主要功能和特点: 高保真视频生成: VIDIM能够生成结构连贯、动作自然流畅的高质... 阅读全文

    优惠 langchain-extract:使用大语言模型(LLMs)从文本和文件中提取信息

  • langchain-extract:使用大语言模型(LLMs)从文本和文件中提取信息
    AI
  • langchain-extract 是一个简单的网络服务器,它允许您使用大型语言模型(LLMs)从文本和文件中提取信息。该服务器基于 FastAPI、LangChain 和 Postgresql 构建。后端设计紧密遵循提取用例的文档,并提供了一个参考应用实现,帮助用户利用 LLMs 进行数据提取操作。这个仓库旨在作为构... 阅读全文

    优惠 开源的OpenAI API 非官方 Go 客户端Go OpenAI

  • 开源的OpenAI API 非官方 Go 客户端Go OpenAI
    AI
  • Go OpenAI是一个开源的OpenAI API 非官方 Go 客户端,目前支持: ChatGPT GPT-3, GPT-4 DALL·E 2 Whisper... 阅读全文

    优惠 Stable Audio 2.0:只需一句提示词,即可生成长达三分钟的音乐

  • Stable Audio 2.0:只需一句提示词,即可生成长达三分钟的音乐
    AI
  • Stability AI在今天推出Stable Audio 2.0,只需要一句提示词,即可生成长达三分钟的44.1 kHz立体声、结构连贯且音质上乘的完整曲目,还支持音频到音频转换能力,以及上传任意音乐对其进行风格转换。目前免费用户可生成10首歌曲,不过从听感来说,生成的歌曲并不如Suno的好听,Stable Audi... 阅读全文

    优惠 200多位音乐人联名呼吁:停止AI对音乐创作的滥用,保护人类创造力!

  • 200多位音乐人联名呼吁:停止AI对音乐创作的滥用,保护人类创造力!
    AI
  • 随着各种AI音乐生成器的不断涌现,尤其是Suno 3.0的惊艳问世,许多音乐人感受到了前所未有的压力。近期,国外200多位知名音乐人联名签署了一封公开信,强烈呼吁停止AI对人类创造力的侵害,并保护艺术家免受其掠夺性使用的伤害。 这封公开信的签名者横跨多个音乐流派和时代,既包括Billie Eilish、J Balvin... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?