推荐类别

栏目分类

优惠 OpenAI推出GPT-4-Turbo 正式版:视觉能力,并支持高达128k的上下文

  • OpenAI推出GPT-4-Turbo 正式版:视觉能力,并支持高达128k的上下文
    AI
  • OpenAI发布了备受期待的GPT-4-Turbo正式版,该版本已在ChatGPT中正式提供,并同时集成到OpenAI API中。GPT-4-Turbo具有视觉能力,并支持高达128k的上下文,为用户提供了更丰富的交互体验。 主要更新亮点: 全面开放:用户现在可以通过“gpt-4-turbo”来使用此模型,最新版本为“... 阅读全文

    优惠 谷歌在180多个国家/地区推出Gemini 1.5 Pro API:具有原生音频理解、系统指令、JSON 模式等新功能

  • 谷歌在180多个国家/地区推出Gemini 1.5 Pro API:具有原生音频理解、系统指令、JSON 模式等新功能
    AI
  • 谷歌在今天宣布将在180多个国家/地区推出Gemini 1.5 Pro 的API,首次提供原生音频(语音)理解能力以及全新的File API,使得文件处理更加便捷。此外,还推出了系统指令和JSON模式等新功能,赋予开发者对模型输出的更多控制权。最后,谷歌发布了性能卓越的下一代文本嵌入模型,超越了同类产品的表现。 以下是... 阅读全文

    优惠 多模态语义分割网络Sigma:有效地结合多种传感器数据,提高了AI系统对复杂环境的理解和适应能力

  • 多模态语义分割网络Sigma:有效地结合多种传感器数据,提高了AI系统对复杂环境的理解和适应能力
    AI
  • 美国卡内基梅隆大学机器人研究所和中国大连理工大学未来技术学院的研究人员推出新型网络Sigma,它是一种用于多模态语义分割的网络。Sigma是一种先进的多模态语义分割网络,它通过有效地结合多种传感器数据,提高了AI系统对复杂环境的理解和适应能力。例如,你有一个机器人,它可以通过摄像头看到世界(这就是RGB图像),但它还能... 阅读全文

    优惠 开源的多功能压缩工具Hummingbird

  • 开源的多功能压缩工具Hummingbird
    工具
  • Hummingbird是一个开源的压缩工具,支持多种格式的文件,支持macOS和Windows 。 Hummingbird使用智能压缩技术来减少文件的大小,支持:jpg、png、webp、svg、gif、gif、css、js、html、mp4、mov,可以设置压缩的同时等比例缩放图片或视频的尺寸。可以拖放文件夹压缩,一... 阅读全文

    优惠 浏览器插件Notes Tab,将您的新标签页界面转化为强大的笔记工具

  • 浏览器插件Notes Tab,将您的新标签页界面转化为强大的笔记工具
    工具
  • Notes Tab是一个浏览器插件,让你可以更快更便捷地记笔记,将您的新标签页界面转化为强大的笔记工具,将所有笔记整理在一个易于访问的地方。支持Markdown,轻松格式化,让您的生活更加有序且高效。... 阅读全文

    优惠 用于训练大语言模型的方法“直接纳什优化(Direct Nash Optimization, DNO)”:让模型通过自我改进来更好地符合人类的偏好和价值观

  • 用于训练大语言模型的方法“直接纳什优化(Direct Nash Optimization, DNO)”:让模型通过自我改进来更好地符合人类的偏好和价值观
    AI
  • 微软搜索团队推出“直接纳什优化(Direct Nash Optimization, DNO)”,这是一种用于训练大型语言模型(LLMs)的方法,目的是让模型通过自我改进来更好地符合人类的偏好和价值观。想象一下,就像有一个智能助手,它可以通过学习我们喜欢什么样的回答和不喜欢什么样的回答,然后不断地调整自己,以提供更符合我... 阅读全文

    优惠 Stream of Search (SoS):大语言模型如何在解决问题时进行搜索和推理

  • Stream of Search (SoS):大语言模型如何在解决问题时进行搜索和推理
    AI
  • 斯坦福大学的研究人员推出Stream of Search (SoS),它教会语言模型如何在解决问题时进行搜索和推理。通常,大语言模型在训练时只接触到正确的解决方案,而不会看到错误或者寻找解决方案的过程。这就像是只学习到了如何走到目的地,而没有学习如何在路上迷路和找回方向。SoS方法通过将搜索过程表示为一系列的文本信息(... 阅读全文

    优惠 “零样本(Zero-Shot)”泛化:多模态模型在没有经过特定训练的情况下,对新概念的识别和图像生成能力

  • “零样本(Zero-Shot)”泛化:多模态模型在没有经过特定训练的情况下,对新概念的识别和图像生成能力
    AI
  • 来自图宾根大学、剑桥大学、牛津大学和谷歌 Deepmind的研究人员发布论文探讨多模态模型在没有经过特定训练的情况下,对新概念的识别和图像生成能力,这种现象被称为“零样本”泛化。研究者们想知道这些模型在预训练数据集中接触到的概念频率如何影响它们在下游任务中的表现。这项研究揭示了多模态模型在处理不常见概念时的局限性,并提... 阅读全文

    优惠 拥有20亿参数的中文大语言模型“Chinese Tiny LLM(CT-LLM)”:为了更好地理解和处理中文而特别设计

  • 拥有20亿参数的中文大语言模型“Chinese Tiny LLM(CT-LLM)”:为了更好地理解和处理中文而特别设计
    AI
  • 来自多模态艺术投影研究共同体、复旦大学、北京大学、上海交通大学、香港科技大学、滑铁卢大学、快手公司和矢量研究所的研究人员推出中文大语言模型“Chinese Tiny LLM”(CT-LLM),这是一个拥有20亿参数的语言模型,这个模型是为了更好地理解和处理中文而特别设计的,它在训练过程中主要使用了中文文本数据,同时也包... 阅读全文

    优惠 CantTalkAboutThis:如何让大语言模型(比如聊天机器人)在对话中保持话题的连贯性和相关性

  • CantTalkAboutThis:如何让大语言模型(比如聊天机器人)在对话中保持话题的连贯性和相关性
    AI
  • 英伟达发布CantTalkAboutThis,如何让大语言模型(比如聊天机器人)在对话中保持话题的连贯性和相关性。总的来说,这项工作提出了一种新的方法来提高语言模型在对话中保持话题相关性的能力,这对于开发能够有效、安全地与用户互动的聊天机器人和虚拟助手至关重要。 例如,你在和一个在线客服聊天,想要解决一个特定的问题,比... 阅读全文

    优惠 如何利用大语言模型来提升人们的社交技能

  • 如何利用大语言模型来提升人们的社交技能
    AI
  • 来自斯坦福大学和乔治亚理工学院发布论文探讨如何利用大语言模型(LLMs)来提升人们的社交技能。社交技能,比如解决冲突的能力,对于我们在工作和生活中有效沟通和成功至关重要。但是,大多数人很难找到练习这些技能的环境。论文提出了一个解决方案,通过一个名为“AI伙伴”和“AI导师”的框架,结合体验式学习和实时反馈,来帮助人们提... 阅读全文

    优惠 三维场景重建“鲁棒高斯点渲染(3DGS)”:从手持设备拍摄的照片中重建出高质量的三维场景成为可能

  • 三维场景重建“鲁棒高斯点渲染(3DGS)”:从手持设备拍摄的照片中重建出高质量的三维场景成为可能
    AI
  • Meta发布新技术“鲁棒高斯点渲染”(Robust Gaussian Splatting,简称3DGS),这是一种用于三维场景重建的方法。想象一下,你有一系列从不同角度拍摄的照片,你想通过这些照片来重建一个三维模型。3DGS技术就是帮助我们从这些二维图像中恢复出三维信息的一种工具。总的来说,这项技术通过提高对实际拍摄数... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?