推荐类别

栏目分类

优惠 基于 Vue、Vite 实现!模仿抖音的移动端短视频项目douyin

  • 基于 Vue、Vite 实现!模仿抖音的移动端短视频项目douyin
    工具
  • douyin 是一个模仿抖音的移动端短视频项目,它基于 Vue、Vite 实现。使用了最新的 Vue 全家桶技术栈,接口数据通过 axios-mock-adapter 模拟。 在线访问 Vercel: http://dy.ttentau.top (国内推荐访问这个) Netlify:https://douyins.ne... 阅读全文

    优惠 国内首个千亿级MoE架构大模型APUS-xDAN-4.0开源

  • 国内首个千亿级MoE架构大模型APUS-xDAN-4.0开源
    AI
  • APUS与新旦智能联合训练、研发的千亿MoE(Mixture of Experts)架构大模型APUS-xDAN-4.0,在GitHub上正式开源,该模型可以在低端算力芯片4090上运行,综合性能达到了GPT-4 的90%。APUS-xDAN大模型4.0(MoE)采用GPT4类似的MoE架构,特点是多专家模型组合,同时... 阅读全文

    优惠 MaGRITTe:根据用户提供的部分图像、顶视图布局信息和文本提示来控制和生成3D场景

  • MaGRITTe:根据用户提供的部分图像、顶视图布局信息和文本提示来控制和生成3D场景
    AI
  • 东京大学的研究人员推出MaGRITTe,它可以根据用户提供的部分图像、顶视图布局信息和文本提示来控制和生成3D场景。想象一下,你有一个不完整的图片,比如一张桌子的角落,还有一些关于房间布局的文字描述,比如“有一个窗户和水槽的厨房”。MaGRITTe能够结合这些信息生成一个完整的3D厨房模型,包括所有的细节和布局。 主要... 阅读全文

    优惠 DPO:提升多模态模型(LMMs)在处理视频指令跟随任务时的表现

  • DPO:提升多模态模型(LMMs)在处理视频指令跟随任务时的表现
    AI
  • 这篇论文介绍了一个名为Direct Preference Optimization (DPO) 的新技术,它旨在提升大型多模态模型(LMMs)在处理视频指令跟随任务时的表现。想象一下,你正在观看一个教学视频,而一个AI模型需要根据视频内容回答关于视频的问题。这项技术可以帮助AI更准确地理解视频内容,并提供更相关、更准确... 阅读全文

    优惠 喜加一 上市首日限时免费! Steam 动作冒险新作《Content Warning》,「搞笑版致命公司」玩法获压倒性好评 0元

  • 上市首日限时免费! Steam 动作冒险新作《Content Warning》,「搞笑版致命公司」玩法获压倒性好评
    STEAM
  • 由瑞典工作室Landfall Games发行的多人合作恐怖探索游戏《Content Warning》今日在Steam正式发售。令人惊喜的是,游戏上市第一天即推出24小时限时免费活动,并收获了压倒性的好评。而限免并非好评的唯一理由,游戏本身的趣味性和创新性同样令人称道。 对于玩过《致命公司(Lethal Company)... 阅读全文

    情报 昆仑万维宣布 4 月 17 日发布并开源“天工大模型 3.0”:4000 亿参数,号称性能超 Grok 1.0

  • 昆仑万维宣布 4 月 17 日发布并开源“天工大模型 3.0”:4000 亿参数,号称性能超 Grok 1.0
  • 昆仑万维集团日前通过官方公众号宣布,在“天工”大模型发布一周年之际,天工大模型 3.0 将于 4 月 17 日正式开启公测,并将同步选择开源。“天工 3.0”采用 4000 亿级参数 MoE(混合专家模型),官方称是全球模型参数最大、性能最强的 MoE 模型之一,性能超过 Grok 1.0。 据介绍,相较于上一代“天工... 阅读全文

    情报 号称“音乐 ChatGPT 时刻”来临,天工 SkyMusic 音乐生成大模型今日邀测

  • 号称“音乐 ChatGPT 时刻”来临,天工 SkyMusic 音乐生成大模型今日邀测
  • 昆仑万维集团今日宣布,其音乐生成大模型“天工 SkyMusic”即日起开启免费邀测。本轮邀测将开放 1000 个免费名额,面向行业媒体、专家、以及感兴趣的音乐从业者开放,正式版将在 4 月 17 日随「天工 3.0」面向全社会免费开放。 “天工 SkyMusic”号称目前国内唯一公开可用 AI 生成大模型,天工 Sky... 阅读全文

    优惠 重磅来袭!无需注册,即刻体验ChatGPT!

  • 重磅来袭!无需注册,即刻体验ChatGPT!
    AI
  • OpenAI,这家引领人工智能潮流的公司,今日宣布了一项激动人心的消息:ChatGPT现已支持无需创建账户即可立即使用!是的,您没听错,无需繁琐的注册流程,即可轻松体验这一人工智能界的“黑马”。 无论是想要学习新知识、寻找创意灵感,还是解答日常生活中的疑问,ChatGPT都能为您提供智能化的帮助。现在,只需打开chat... 阅读全文

    优惠 「免费文字转语音」——一款实用的线上文本转语音服务

  • 「免费文字转语音」——一款实用的线上文本转语音服务
    工具
  • 「免费文字转语音」是一款方便易用的线上服务,能够将文本内容转换为逼真的语音输出。该服务采用微软的AI语音库,合成出接近真人声音的音调,让文本内容更生动、更具表现力。该服务支持多达129种语言,并提供了超过330种神经网络语音选择,使得全世界各种语言用户都能轻松使用。不仅如此,「免费文字转语音」还具备语音合成标记语言(S... 阅读全文

    优惠 苹果发布ReALM:理解用户的指令和问题,并且能够根据上下文给出正确的回应

  • 苹果发布ReALM:理解用户的指令和问题,并且能够根据上下文给出正确的回应
    AI
  • 苹果发布论文的主题是“ReALM: Reference Resolution As Language Modeling”,即“作为语言建模的参考解析”。参考解析是一个理解语言中指代问题的重要任务,它帮助系统理解句子中的“它”或“那个”指的是什么。这对于虚拟助手来说尤其重要,因为它们需要理解用户的指令和问题,并且能够根据... 阅读全文

    优惠 针对视觉语言模型的新挑战“Unsolvable Problem Detection (UPD)”

  • 针对视觉语言模型的新挑战“Unsolvable Problem Detection (UPD)”
    AI
  • 这篇论文介绍了一个名为“Unsolvable Problem Detection (UPD)”的新挑战,主要针对视觉语言模型(Vision Language Models,简称VLMs)。视觉语言模型是一种人工智能技术,它能够理解和解释图像和文本之间的关系。想象一下,你有一个问题,比如“图片中的物体是什么颜色的?”而V... 阅读全文

    优惠 Tactile-Informed 3DGS:结合了视觉数据和触觉传感信息,用于重建复杂表面的3D模型并进行新视角的合成

  • Tactile-Informed 3DGS:结合了视觉数据和触觉传感信息,用于重建复杂表面的3D模型并进行新视角的合成
    AI
  • 来自布里斯托大学、谷歌和英伟达的研究人员推出Tactile-Informed 3DGS,它结合了视觉数据和触觉传感信息,用于重建复杂表面的3D模型并进行新视角的合成。这项技术特别适用于处理具有光泽和反射性的表面,因为传统的3D重建方法在处理这类表面时往往会遇到困难。例如,想象一个考古学家正在研究一件古老的金属制品,他们... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?