人工智能

优惠 苹果发布一种新颖的方法,用于将App图片与人们可能用来发现该应用程序的搜索短语进行匹配

  • 苹果发布一种新颖的方法,用于将App图片与人们可能用来发现该应用程序的搜索短语进行匹配
    AI
  • 苹果发布一种新颖的方法,用于将应用程序(App)的图片与人们可能用来发现该应用程序的搜索短语进行匹配。这种技术对于应用开发者来说非常有用,因为它可以帮助他们更好地推广自己的应用程序。例如,你在开发一个旅游应用,想要吸引用户下载。你可能会上传一些美丽的风景图片到应用商店。这项技术可以帮助你理解哪些图片最有可能吸引那些搜索... 阅读全文

    优惠 自动驾驶领域关键技术!三维多目标跟踪3D MOT:能够让汽车实时地识别并追踪周围的物体,比如其他车辆和行人,同时准确估计它们的速度和加速度等状态

  • 自动驾驶领域关键技术!三维多目标跟踪3D MOT:能够让汽车实时地识别并追踪周围的物体,比如其他车辆和行人,同时准确估计它们的速度和加速度等状态
    AI
  • Waymo与Google Research发布自动驾驶领域中的一个关键技术三维多目标跟踪(3D Multi-Object Tracking,简称3D MOT)。这项技术对于自动驾驶汽车的安全行驶至关重要,因为它能够让汽车实时地识别并追踪周围的物体,比如其他车辆和行人,同时准确估计它们的速度和加速度等状态。例如,你坐在一... 阅读全文

    优惠 英伟达聊天机器人ChatRTX 发布 0.3 版本更新:新增照片搜索、AI 语音识别等功能

  • 英伟达聊天机器人ChatRTX 发布 0.3 版本更新:新增照片搜索、AI 语音识别等功能
    AI
  • 英伟达的 ChatRTX 应用在其网站上发布了备受期待的 0.3 版本更新。这款类似 ChatGPT 的应用的更新首次在 英伟达 3月份的 GTC 会议上被预告,带来了一系列新功能,包括照片搜索能力、AI 驱动的语音识别以及与更多大语言模型(LLM)的兼容性。 本次更新亮点包括: 照片搜索新境界:集成OpenAI的CL... 阅读全文

    优惠 Nexa AI推出新型语言模型框架Octopus v4:它使用了一种图结构来整合多个开源的语言模型,每个模型都针对特定的任务进行了优化

  • Nexa AI推出新型语言模型框架Octopus v4:它使用了一种图结构来整合多个开源的语言模型,每个模型都针对特定的任务进行了优化
    AI
  • Nexa AI推出新型语言模型框架Octopus v4,这个框架特别之处在于它使用了一种图结构(graph structure)来整合多个开源的语言模型,每个模型都针对特定的任务进行了优化。Octopus v4模型使用功能令牌(functional tokens)来智能地将用户查询导向最合适的垂直模型(vertical... 阅读全文

    优惠 大模型微调技术QLoRA:可以显著扩展大语言模型的上下文长度,特别是针对Llama-3-8B-Instruct模型

  • 大模型微调技术QLoRA:可以显著扩展大语言模型的上下文长度,特别是针对Llama-3-8B-Instruct模型
    AI
  • 北京人工智能研究院和中国人民大学高瓴人工智能学院推出微调技术QLoRA,可以显著扩展大语言模型的上下文长度,特别是针对Llama-3-8B-Instruct模型,上下文长度是指模型在生成回答时能够考虑的输入信息的最大长度。开发者成功地将Llama-3模型的上下文长度从8,000个令牌(tokens)扩展到80,000个... 阅读全文

    优惠 基于Gemini模型!谷歌推出AI医疗模型Med-Gemini,专门为医学领域设计的多模态(能够处理文本、图像、视频等不同类型数据)大语言模型

  • 基于Gemini模型!谷歌推出AI医疗模型Med-Gemini,专门为医学领域设计的多模态(能够处理文本、图像、视频等不同类型数据)大语言模型
    AI
  • 谷歌推出AI医疗模型Med-Gemini,它们是专门为医学领域设计的多模态(能够处理文本、图像、视频等不同类型数据)大语言模型。Med-Gemini模型基于Gemini模型,通过特殊的训练和定制,能够在医学领域表现出强大的能力,包括理解复杂的医疗文本、处理多模态医疗数据,以及处理长文本的上下文信息。 例如,医生需要分析... 阅读全文

    优惠 迭代推理偏好优化Iterative RPO:提高大语言模型(LLMs)在推理任务中的表现

  • 迭代推理偏好优化Iterative RPO:提高大语言模型(LLMs)在推理任务中的表现
    AI
  • Meta和纽约大学的研究人员发布论文,这篇论文的主题是关于如何提高大语言模型(LLMs)在推理任务中的表现。研究者们开发了一种迭代推理偏好优化(Iterative Reasoning Preference Optimization,简称Iterative RPO)的方法,这种方法特别关注基于“思维链”(Chain-of... 阅读全文

    优惠 更加高效和快速!多令牌预测(Multi-token Prediction):用于训练像GPT和Llama这样的大型语言模型

  • 更加高效和快速!多令牌预测(Multi-token Prediction):用于训练像GPT和Llama这样的大型语言模型
    AI
  • 这篇论文的主题是关于如何改进大语言模型(LLMs)的训练方法,使其更加高效和快速。研究者们提出了一种新的方法,叫做“多令牌预测”(Multi-token Prediction),用于训练像GPT和Llama这样的大型语言模型。这些模型通常通过预测文本序列中的下一个令牌(token)来进行训练,但这种方法在获取语言、世界... 阅读全文

    优惠 新型神经网络架构KANs:作为多层感知器( MLPs)的有前景的替代品

  • 新型神经网络架构KANs:作为多层感知器( MLPs)的有前景的替代品
    AI
  • 来自麻省理工学院、加州理工学院、东北大学和美国国家科学基金会人工智能和基本交互研究所的研究人员推出一种新型的神经网络架构 Kolmogorov-Arnold Networks(简称 KANs)。这种网络架构是受 Kolmogorov-Arnold 表示定理启发而提出的,旨在作为多层感知器(Multi-Layer Per... 阅读全文

    优惠 GitHub Copilot Workspace预览版上线:用自然语言重塑软件开发流程

  • GitHub Copilot Workspace预览版上线:用自然语言重塑软件开发流程
    AI
  • GitHub于4月29日推出了Copilot Workspace的技术预览版,这一创新开发者环境依托于多种Copilot代理,旨在促进自然语言与开发工作的深度融合。开发者能够在Copilot Workspace中无缝进行创意构思、项目规划、编码构建、测试及执行,全面跟踪从创意萌芽至代码实现的完整路径。 GitHub C... 阅读全文

    优惠 Meta推出AdvPrompter:快速适应性地为大语言模型(LLMs)生成对抗性提示(adversarial prompts)

  • Meta推出AdvPrompter:快速适应性地为大语言模型(LLMs)生成对抗性提示(adversarial prompts)
  • Meta推出AdvPrompter,它能够快速适应性地为大语言模型(LLMs)生成对抗性提示(adversarial prompts)。这些对抗性提示是用来测试和提高语言模型的安全性,确保它们不会生成不适当或有害的内容。例如,我们有一个语言模型,我们希望确保它不会帮助用户进行欺诈活动。通过AdvPrompter,我们可... 阅读全文

    优惠 HaLo-NeRF系统:用于理解和探索大规模地标性建筑照片集合的先进方法

  • HaLo-NeRF系统:用于理解和探索大规模地标性建筑照片集合的先进方法
    AI
  • 特拉维夫大学和芝加哥大学的研究人员推出HaLo-NeRF系统,它是一个用于理解和探索大规模地标性建筑照片集合的先进方法。这个系统能够将文本描述与场景中的语义区域联系起来,从而允许用户在三维空间中定位和探索特定的建筑特征。例如,你是一名对巴黎圣母院感兴趣的历史学生。你可以使用HaLo-NeRF系统,上传圣母院的照片集合,... 阅读全文