推荐类别

栏目分类

情报 Chrome 实验性AI文字生成功能「帮我写」上线,但暂时仅限美国使用

  • Chrome 实验性AI文字生成功能「帮我写」上线,但暂时仅限美国使用
  • 谷歌在Chrome 122版本中引入了一项实验性的AI文字生成功能“帮我写(Help me write)”,该功能由Gemini模型驱动,可根据用户提供的简短提示,在理解网页上下文的基础上生成适宜的句子或段落。例如,在网购产品评论页面环境下,当给出如“搬到小地方,出售气炸锅,50美元”的提示时,“帮我写”能够自动生成一... 阅读全文

    情报 美国“贴吧”Reddit要上市了,还要深化与谷歌的合作

  • 美国“贴吧”Reddit要上市了,还要深化与谷歌的合作
  • 美国新闻社交平台Reddit在2月22日宣布了一个双喜临门的消息:一方面,该公司已向美国证券交易委员会(SEC)递交了股票首次公开发行(IPO)的申请,准备以RDDT为代号在纽约证券交易所(NYSE)上市;另一方面,Reddit宣布将与Google扩大合作,允许后者利用其内容来训练AI模型,每年价值高达6000万美元。... 阅读全文

    优惠 CapCut(剪映海外版)推出视频生成功能,可以通过文本生成4秒的视频

  • CapCut(剪映海外版)推出视频生成功能,可以通过文本生成4秒的视频
    AI
  • CapCut(剪映海外版)推出视频生成功能,可以通过文本生成4秒的视频,支持多种4:3、9:16等多种比例的视频类型,支持中文提示词,每人每天可以免费生成五次。从生成效果来看尚可,但目前排队情况严重,生成一个视频可能要排队近100分钟,网站还出现打不开的情况,想试用的朋友可以等等看。    ... 阅读全文

    情报 Stability AI推出全新文生图模型Stable Diffusion 3

  • Stability AI推出全新文生图模型Stable Diffusion 3
  • 备受瞩目的AI技术领军企业——Stability AI,正式对外披露其最新的研究成果:Stable Diffusion 3模型的早期预览版本。这款堪称目前功能最强大的文本驱动图像生成模型,在处理多元主题提示、图像精细化程度及拼写准确性等方面均展现了显著的进步。 尽管Stable Diffusion 3模型尚处于有限使用... 阅读全文

    优惠 LongRoPE:显著扩展大语言模型(LLMs)的上下文窗口,达到了2048k个标记的惊人长度

  • LongRoPE:显著扩展大语言模型(LLMs)的上下文窗口,达到了2048k个标记的惊人长度
    AI
  • 来自微软的研究人员发布论文介绍了一种名为LongRoPE的技术,它能够显著扩展大语言模型(LLMs)的上下文窗口,达到了2048k个标记的惊人长度。这是首次实现这样的扩展,同时在保持原始短上下文窗口性能的同时,只需要1k步的微调,训练长度在256k以内。这项技术通过三个关键创新实现:首先,它识别并利用了位置插值中的两种... 阅读全文

    优惠 Meta推出多模态开放数据集AEA,通过Project Aria眼镜收集

  • Meta推出多模态开放数据集AEA,通过Project Aria眼镜收集
    AI
  • Meta推出数据集Aria Everyday Activities (AEA) ,这是一个以第一人称视角记录的多模态开放数据集,通过Project Aria眼镜收集。AEA数据集包含了多个佩戴者在五个不同地理位置的室内环境中记录的143个日常活动序列。每个记录都包含了通过Project Aria眼镜收集的多模态传感器数... 阅读全文

    优惠 在深度强化学习中,如何通过修剪网络(pruning)来提高模型的性能

  • 在深度强化学习中,如何通过修剪网络(pruning)来提高模型的性能
    AI
  • 来自Google DeepMind、魁北克人工智能研究所、蒙特利尔大学的研究人员发布论文探讨了在深度强化学习(Deep Reinforcement Learning, DRL)中,如何通过修剪网络(pruning)来提高模型的性能。修剪网络是一种优化技术,它通过移除神经网络中不重要的参数(通常是权重较小的连接),来减少... 阅读全文

    优惠 BBA:提高大型视觉-语言模型(LVLMs)在复杂多模态推理任务中的表现

  • BBA:提高大型视觉-语言模型(LVLMs)在复杂多模态推理任务中的表现
    AI
  • 来自香港大学、腾讯AI实验室的研究人员发布论文介绍了一种名为Bi-Modal Behavioral Alignment (BBA) 的方法,它是为了提高大型视觉-语言模型(LVLMs)在复杂多模态推理任务中的表现。BBA方法的核心在于它能够更好地利用视觉信息和领域特定语言(DSL)的表示,这两种信息在传统的Chain-... 阅读全文

    优惠 新型解码框架Ouroboros:加速大语言模型(LLMs)的推理过程

  • 新型解码框架Ouroboros:加速大语言模型(LLMs)的推理过程
    AI
  • 这篇论文介绍了一种名为Ouroboros的新型解码框架,它旨在加速大语言模型(LLMs)的推理过程。Ouroboros通过一种称为“推测性解码”的方法,使用一个小型模型快速生成草稿,然后利用大型模型进行验证和修正,以减少时间开销。这种方法不需要对模型进行额外训练,也不会影响生成质量。 GitHub地址:https://... 阅读全文

    优惠 USER-LLM框架:用于改进大语言模型(LLMs)以更好地理解和适应用户交互数据

  • USER-LLM框架:用于改进大语言模型(LLMs)以更好地理解和适应用户交互数据
    AI
  • 来自谷歌的研究人员发布论文介绍了一个名为USER-LLM的框架,它是一个用于改进大语言模型(LLMs)以更好地理解和适应用户交互数据的系统。USER-LLM通过使用用户嵌入(user embeddings)来为LLMs提供上下文信息,这些嵌入是从用户的多样化交互数据中自动学习得到的,能够捕捉用户的偏好和行为模式。 论文... 阅读全文

    优惠 一种新颖的音乐风格转换方法:利用了扩散模型和时间变化的文本反演技术

  • 一种新颖的音乐风格转换方法:利用了扩散模型和时间变化的文本反演技术
    AI
  • 来自中国科学院自动化研究所、中国科学院大学人工智能学院、中国科学院计算技术研究所和快手的研究人员提出一种新颖的音乐风格转换方法,它利用了扩散模型和时间变化的文本反演技术。这种方法可以有效地捕捉音乐属性,即使在数据量很少的情况下也能实现。它通过一个创新的时间变化文本反演模块来精确捕捉不同层次的梅尔频谱图特征,并在推理过程... 阅读全文

    优惠 大语言模型(LLMs)在面对对抗性攻击时的脆弱性

  • 大语言模型(LLMs)在面对对抗性攻击时的脆弱性
    AI
  • 来自马里兰大学帕克分校的研究人员发布论文探讨了大语言模型(LLMs)在面对对抗性攻击时的脆弱性。对抗性攻击是指故意设计输入,以诱导模型产生非预期或有害的输出。论文的主要目的是扩展我们对LLMs对抗性攻击的理解,不仅仅是“越狱”(即让模型产生违反其训练目标的输出),而是包括更广泛的攻击类型和目标。 论文地址:https:... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?