推荐类别

栏目分类

优惠 图小小(Pic Smaller):开源图片压缩工具,支持PEG、PNG、WEBP、AVIF、SVG和GIF格式压缩

  • 图小小(Pic Smaller):开源图片压缩工具,支持PEG、PNG、WEBP、AVIF、SVG和GIF格式压缩
    工具
  • 图小小(Pic Smaller)是一款开源的图片压缩工具,它提供了一种简单易用的方式来批量处理图片文件和文件夹。这款工具支持多种图片格式,包括JPEG、PNG、WEBP、AVIF、SVG和GIF,能够满足不同用户的需求。 开源与技术 ...... 阅读全文

    优惠 用于初始化大型深度学习模型!新型深度学习模型参数预测方法LOGAH

  • 用于初始化大型深度学习模型!新型深度学习模型参数预测方法LOGAH
    AI
  • 这篇论文的主题是关于一种新型的深度学习模型参数预测方法,称为LOGAH(Low-rank GrAph Hypernetworks),它用于初始化大型深度学习模型,特别是拥有数亿参数的Transformer模型,如视觉Transformer(ViT)和生成式预 ...... 阅读全文

    优惠 大型多模态模型M3:设计灵感来源于俄罗斯套娃,它能够将视觉内容表示为嵌套的视觉标记

  • 大型多模态模型M3:设计灵感来源于俄罗斯套娃,它能够将视觉内容表示为嵌套的视觉标记
    AI
  • 威斯康星大学麦迪逊分校和微软的研究人员推出大型多模态模型M3(Matryoshka Multimodal Models)。这种模型的设计灵感来源于俄罗斯套娃(Matryoshka Dolls),它能够将视觉内容表示为嵌套的视觉标记(tokens),这些 ...... 阅读全文

    优惠 麻省理工学院推出新技术Trans-LoRA:一种用于大语言模型(LLMs)的参数高效微调(PEFT)方法

  • 麻省理工学院推出新技术Trans-LoRA:一种用于大语言模型(LLMs)的参数高效微调(PEFT)方法
    AI
  • 麻省理工学院推出新技术Trans-LoRA,它是一种用于大语言模型(LLMs)的参数高效微调(PEFT)方法。Trans-LoRA的核心目标是在不访问原始训练数据的情况下,实现低秩适配器(LoRA)模型在不同基础模型之间的无损转移。 ...... 阅读全文

    优惠 Meta发布视觉语言模型介绍论文,全面介绍视觉语言模型

  • Meta发布视觉语言模型介绍论文,全面介绍视觉语言模型
    AI
  • 这篇论文的主题是介绍和探讨视觉-语言模型(Vision-Language Models,简称VLMs)。这类模型旨在将视觉信息(如图像)与语言信息(如文字描述)结合起来,以实现更丰富的人工智能应用。简单来说,VLMs就是教会计算机 ...... 阅读全文

    优惠 新框架Part123:能够从单视图图像中重建出具有结构意义的部分(part-aware)的3D模型

  • 新框架Part123:能够从单视图图像中重建出具有结构意义的部分(part-aware)的3D模型
    AI
  • 香港大学和清华大学的研究人员推出新框架Part123,它能够从单视图图像中重建出具有结构意义的部分(part-aware)的3D模型。Part123利用了扩散模型(diffusion models)生成多视图一致的图像,并结合了Segment Anythi ...... 阅读全文

    优惠 Zyphra推出新型混合模型Zamba:结合了SSM和Transformer的特点,提供与大型开放模型相媲美的性能,同时在参数成本上保持较低的水平

  • Zyphra推出新型混合模型Zamba:结合了SSM和Transformer的特点,提供与大型开放模型相媲美的性能,同时在参数成本上保持较低的水平
    AI
  • Zyphra推出新型人工智能语言模型Zamba,Zamba是一个7亿参数(7B SSM)的混合模型,它结合了SSM(State Space Model,状态空间模型)和Transformer的特点,旨在提供与大型开放模型相媲美的性能,同时在参数成本上保持 ...... 阅读全文

    优惠 如何让Transformer模型更好地执行数学运算,特别是大数字的加法

  • 如何让Transformer模型更好地执行数学运算,特别是大数字的加法
    AI
  • 马里兰大学、劳伦斯利弗莫尔国家实验室、蒂宾根埃利斯研究所、马克斯·普朗克智能系统研究所、图宾根人工智能中心和卡内基梅隆大学的研究人员发布论文,论文的主题是关于如何让一种名为“Transformer”的人工智能模型更 ...... 阅读全文

    优惠 文本引导的2D头像生成框架InstructAvatar:能够根据自然语言指令来控制头像的表情和动作

  • 文本引导的2D头像生成框架InstructAvatar:能够根据自然语言指令来控制头像的表情和动作
    AI
  • 北京大学的研究人员推出类似阿里的Emo和微软的VASA-1的文本引导的2D头像生成框架InstructAvatar,它能够根据自然语言指令来控制头像的表情和动作。简单来说,InstructAvatar就像是一个虚拟的“演员”,可以根据你给它 ...... 阅读全文

    优惠 3D建模系统CraftsMan:能够生成高保真的3D几何体,这些几何体形状多样、网格拓扑规则,并具有详细的表面细节

  • 3D建模系统CraftsMan:能够生成高保真的3D几何体,这些几何体形状多样、网格拓扑规则,并具有详细的表面细节
    AI
  • 香港科技大学、腾讯AI实验室的研究人员推出新颖3D建模系统CraftsMan,它能够生成高保真的3D几何体,这些几何体形状多样、网格拓扑规则,并具有详细的表面细节。更重要的是,CraftsMan允许以交互式的方式对几何体进行 ...... 阅读全文

    优惠 transformers模型是否能够学习隐式推理,即在没有明确指导的情况下对知识进行推理

  • transformers模型是否能够学习隐式推理,即在没有明确指导的情况下对知识进行推理
    AI
  • 俄亥俄州立大学 和卡内基梅隆大学的研究人员发布论文探讨了transformers,这是一种在自然语言处理(NLP)领域广泛使用的模型,是否能够学习隐式推理(implicit reasoning),即在没有明确指导的情况下对知识进行推理 ...... 阅读全文

    优惠 新型大型语言模型AutoCoder:通过先进的人工智能技术,帮助人们更高效、更准确地编写代码

  • 新型大型语言模型AutoCoder:通过先进的人工智能技术,帮助人们更高效、更准确地编写代码
    AI
  • 康涅狄格大学和AIGCode推出新型大型语言模型AutoCoder,它在代码生成方面取得了显著的进展。总的来说,AutoCoder是一个强大的工具,它通过先进的人工智能技术,帮助人们更高效、更准确地编写代码,极大地推动了软件 ...... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?