推荐类别

栏目分类

优惠 阿里巴巴开源Qwen2系列模型,包含5个尺寸的预训练和指令微调模型

  • 阿里巴巴开源Qwen2系列模型,包含5个尺寸的预训练和指令微调模型
    AI
  • 阿里在4月份发布最后一个Qwen1.5模型后,在昨晚正式开源了Qwen2系列模型。这一次,阿里为大家带来了: 5个尺寸的预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B; 在中 ...... 阅读全文

    优惠 中国版Sora?快手推出自研视频生成大模型可灵大模型(Kling)

  • 中国版Sora?快手推出自研视频生成大模型可灵大模型(Kling)
    AI
  • 中国版Sora?快手推出自研视频生成大模型可灵大模型(Kling),可以生成2分钟的视频,目前处于测试阶段,需要下载APP申请加入候补名单。 以下是官方的介绍: 1️⃣大幅度的合理运动:可灵采用3D时空联合注意力机制,能 ...... 阅读全文

    优惠 新型智能对话推荐系统ILM:结合了大语言模型的理解和生成能力以及推荐系统的个性化推荐功能

  • 新型智能对话推荐系统ILM:结合了大语言模型的理解和生成能力以及推荐系统的个性化推荐功能
    AI
  • 谷歌推出一种新型的对话推荐系统,称为“Item-Language Model”(ILM)。这个系统结合了大语言模型(LLMs)的理解和生成能力以及推荐系统的个性化推荐功能。例如,你正在和一个非常聪明的在线购物助手聊天。你告诉它你 ...... 阅读全文

    优惠 创新的知识蒸馏方法PLaD:用于从大语言模型中提取知识并将其传授给更紧凑的学生模型

  • 创新的知识蒸馏方法PLaD:用于从大语言模型中提取知识并将其传授给更紧凑的学生模型
    AI
  • 佐治亚理工学院和谷歌的研究人员推出新方法PLaD(Preference-based Large Language Model Distillation),它用于从大语言模型(LLMs)中提取知识并将其传授给更紧凑的学生模型。这种方法特别适用于资源受限的环境中 ...... 阅读全文

    优惠 小多科技推出新型语言模型Xmodel-LM:紧凑高效的11亿参数(1.1B)模型,预训练于超过2万亿个token的数据集之上

  • 小多科技推出新型语言模型Xmodel-LM:紧凑高效的11亿参数(1.1B)模型,预训练于超过2万亿个token的数据集之上
    AI
  • 小多科技推出新型语言模型Xmodel-LM,它是一个紧凑高效的11亿参数(1.1B)模型,预训练于超过2万亿个token的数据集之上。Xmodel-LM的特点在于它在较小的模型规模下,却能展现出与现有开源语言模型相似或更优的性能。 ...... 阅读全文

    优惠 强化学习算法DAAs:人类反馈强化学习中的应用

  • 强化学习算法DAAs:人类反馈强化学习中的应用
    AI
  • 斯坦福大学、马萨诸塞大学阿默斯特分校和德克萨斯大学奥斯汀分校的研究人员推出强化学习算法Direct Alignment Algorithms(直接对齐算法,简称DAAs),特别是在人类反馈强化学习(Reinforcement Learning from Human ...... 阅读全文

    优惠 微软推出LiveSpeech系统:低延迟的零样本TTS合成技术

  • 微软推出LiveSpeech系统:低延迟的零样本TTS合成技术
    AI
  • 微软推出LiveSpeech系统,它是一种低延迟的零样本(zero-shot)文本到语音(Text-to-Speech, TTS)合成技术。零样本意味着系统可以在没有特定说话人数据训练的情况下,模仿任何人的声音来生成语音。这项技术特别适用 ...... 阅读全文

    优惠 新型音频表示学习模型Audio Mamba:基于状态空间模型构建的

  • 新型音频表示学习模型Audio Mamba:基于状态空间模型构建的
    AI
  • 韩国科学技术院推出新型音频表示学习模型Audio Mamba(AuM),它是基于状态空间模型(State Space Models, SSMs)构建的,与传统的基于自注意力(self-attention)机制的Transformer模型不同,AuM不依赖于计算密集型 ...... 阅读全文

    优惠 新型神经网络架构Block Transformer:用于提升自然语言处理(NLP)任务中的推断速度

  • 新型神经网络架构Block Transformer:用于提升自然语言处理(NLP)任务中的推断速度
    AI
  • 韩国科学技术研究院、LG 人工智能研究和Google DeepMind的研究人员推出新型神经网络架构Block Transformer,它主要用于提升自然语言处理(NLP)任务中的推断速度。在NLP中,Transformer模型是一种非常强大的工具,它 ...... 阅读全文

    优惠 新型图像到3D生成框架Ouroboros3D:将多视角图像生成和3D重建集成到一个递归扩散过程中,通过自条件机制联合训练这两个模块,使它们能够相互适应,从而实现更稳健的推理

  • 新型图像到3D生成框架Ouroboros3D:将多视角图像生成和3D重建集成到一个递归扩散过程中,通过自条件机制联合训练这两个模块,使它们能够相互适应,从而实现更稳健的推理
    AI
  • 北京航空航天大学、上海人工智能实验室和VAST推出新型图像到3D生成框架Ouroboros3D,这个框架的核心特点是将多视角图像生成和3D重建集成到一个递归扩散过程中,通过自条件机制联合训练这两个模块,使它们能够相互适 ...... 阅读全文

    优惠 Mobile-Agent-v2: 通过多代理协作有效导航的移动设备操作助手

  • Mobile-Agent-v2: 通过多代理协作有效导航的移动设备操作助手
    AI
  • 北京交通大学和阿里巴巴集团的研究人员推出移动设备操作助手Mobile-Agent-v2,它通过多智能体(多个代理)的协作来有效导航和执行任务。这个系统是为了解决现有技术在处理移动设备操作任务时面临的两大挑战:任务进 ...... 阅读全文

    优惠 大规模仿真框架RoboCasa:为了训练能够在日常生活环境中工作的通用机器人代理而设计

  • 大规模仿真框架RoboCasa:为了训练能够在日常生活环境中工作的通用机器人代理而设计
    AI
  • 德克萨斯大学奥斯汀分校和英伟达的研究人员推出大规模仿真框架RoboCasa,它是为了训练能够在日常生活环境中工作的通用机器人代理而设计的。RoboCasa的核心是提供一个现实且多样化的厨房环境,它包含了大量的3D资产、 ...... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?