推荐类别

栏目分类

优惠 全新金融领域评估基准方法FinBen:专为评估大语言模型(LLMs)在金融领域的能力而设计

  • 全新金融领域评估基准方法FinBen:专为评估大语言模型(LLMs)在金融领域的能力而设计
    AI
  • 来自国内多所大学的研究人员推出一款全新金融领域评估基准方法FinBen,它专为评估大语言模型(LLMs)在金融领域的能力而设计。FinBen包含了35个数据集,覆盖了23个金融任务,这些任务根据Cattell-Horn-Carroll(CHC)理论分为三个难度层次,以评估LLMs在归纳推理、联想记忆、定量推理、晶体智力... 阅读全文

    优惠 基准测试MAD-Bench:系统地检验多模态大语言模型在面对文本提示和图像不一致时的冲突解决能力

  • 基准测试MAD-Bench:系统地检验多模态大语言模型在面对文本提示和图像不一致时的冲突解决能力
    AI
  • 关于评估多模态大语言模型(MLLMs)在处理欺骗性提示(deceptive prompts)时的脆弱性,来自苹果的研究人员创建了一个名为MAD-Bench的基准测试,它包含了850个测试样本,分为六个类别,如不存在的对象、对象数量、空间关系和视觉混淆等,用以系统地检验MLLMs在面对文本提示和图像不一致时的冲突解决能力... 阅读全文

    优惠 结合触觉、视觉和语言的多模态数据集TVL:用于训练和评估能够理解和生成触觉感受描述的模型

  • 结合触觉、视觉和语言的多模态数据集TVL:用于训练和评估能够理解和生成触觉感受描述的模型
    AI
  • 加州大学伯克利分校、Meta AI和德累斯顿工业大学的研究人员推出一个关于创建一个结合触觉、视觉和语言的多模态数据集,用于训练和评估能够理解和生成触觉感受描述的模型。这个数据集名为Touch-Vision-Language (TVL),它包含了44,000对视觉-触觉观察数据,其中10%由人类标注,90%由GPT-4V... 阅读全文

    优惠 评估基准方法TOFUEVAL:评估大语言模型(LLMs)在特定主题对话摘要生成中的准确性

  • 评估基准方法TOFUEVAL:评估大语言模型(LLMs)在特定主题对话摘要生成中的准确性
    AI
  • 来自亚马逊AWS AI 实验室、韩国科学院、德克萨斯大学奥斯汀分校的研究人员推出新的评估基准方法TOFUEVAL,评估大语言模型(LLMs)在特定主题对话摘要生成中的准确性。它专注于对话摘要的事实一致性。这个基准通过人类专家对由不同大小的LLMs生成的摘要进行事实一致性的二元句子级标注,并提供详细解释,以揭示不一致的句... 阅读全文

    优惠 小米PC换机助手来了:最高速率90MB/s!数据迁移一键搞定

  • 小米PC换机助手来了:最高速率90MB/s!数据迁移一键搞定
    工具
  • 今天,有消息指出小米官方正式推出了小米PC换机助手,并提供了官方网站的访问链接,该工具旨在支持多种不同旧机型的数据快速迁移到新款的小米个人电脑上,推测这一发布极有可能是为了配合即将于明日发布的Redmi Book Pro 2024系列新品。 小米PC换机助手功能强大,主打一键迁移功能,可将用户的重要数据以最高每秒90M... 阅读全文

    优惠 GLAN:用于大语言模型(LLMs)的通用和可扩展的指令调整方法

  • GLAN:用于大语言模型(LLMs)的通用和可扩展的指令调整方法
    AI
  • 来自微软的研究人员推出一个名为Generalized Instruction Tuning(简称GLAN)的方法,它是一种用于大语言模型(LLMs)的通用和可扩展的指令调整方法。GLAN的核心思想是利用人类知识的预分类体系作为输入,生成大规模的合成指令数据,覆盖各个学科领域。这种方法不依赖于种子示例或现有数据集来构建指... 阅读全文

    优惠 预指令调优(PIT):让大语言模型在处理新文档时更有效地吸收和应用知识

  • 预指令调优(PIT):让大语言模型在处理新文档时更有效地吸收和应用知识
    AI
  • 来自卡内基梅隆大学、华盛顿大学和Meta的研究人员提出了一种新的训练方法预指令调优(Pre-Instruction-Tuning,简称PIT),让大语言模型在处理新文档时更有效地吸收和应用知识。总的来说,这篇论文提出了一种新的方法来提升LLMs的知识吸收和应用能力,这对于构建更加智能和适应性强的AI系统具有重要意义。 ... 阅读全文

    优惠 新游发售 《星际战甲》正式登陆苹果 iOS / iPadOS,支持跨平台存档

  • 《星际战甲》正式登陆苹果 iOS / iPadOS,支持跨平台存档
    App Store
  • 由Digital Extremes开发的免费多人在线第三人称射击动作角色扮演游戏《Warframe(星际战甲)》,现已登陆iOS设备。尽管该游戏去年就已正式公布,但iOS版本绝非PC版的简单移植。 iPhone和iPad玩家将享受到一些专为触屏体验设计的独特功能,旨在提升游戏互动性。其中,最引人注目的移动特性要数“自动... 阅读全文

    优惠 新游发售 LOL 衍生游戏《班德尔城物语:英雄联盟外传》正式发售 185元

  • LOL 衍生游戏《班德尔城物语:英雄联盟外传》正式发售
  • 拳头新作《班德尔城物语:英雄联盟外传》是一款生产建造类角色扮演游戏,Steam 国区定价 185/219 元,将于 2 月 22 日 3 点解锁。《班德尔城物语:英雄联盟外传》是一款生产建造类角色扮演游戏,背景设定在班德尔城那天马行空的幻想世界中。在一场派对发生意外后,连接你的故乡的魔法传送门突然倒塌,整个班德尔城都陷... 阅读全文

    优惠 专为懒人打造的高效笔记工具「不写笔记」

  • 专为懒人打造的高效笔记工具「不写笔记」
    工具
  • 不写笔记是一款专为懒人打造的高效笔记工具,它让记笔记变得前所未有的轻松快捷。只需简单操作鼠标和键盘快捷键,如Alt+P,即可一键提取网页核心内容并自动保存至笔记。同时,浏览器插件可实现划词选中后右键直接添加到笔记,甚至支持增量更新最近一条笔记的内容。 地址:https://home.zhuayuya.com/bxnot... 阅读全文

    优惠 经典游戏平台「老游戏在线玩」:超过 2500 款 FC、SFC、N64、GB、NDS 等经典游戏免费畅玩!

  • 经典游戏平台「老游戏在线玩」:超过 2500 款 FC、SFC、N64、GB、NDS 等经典游戏免费畅玩!
    工具
  • 「老游戏在线玩」是一个便捷的经典游戏平台,让你用电脑或手机浏览器轻松重温那些年代的老游戏!目前已收录超过2500款游戏,包括FC、SFC、N64、PS、Game Boy等众多经典平台的游戏。在浏览器玩老游戏,存档是个大问题。但别担心,「老游戏在线玩」为你提供了自动存档功能,还能将存档导出分享给其他人。每个游戏都有详细的... 阅读全文

    优惠 AI芯片初创Groq引领新潮流,LPU芯片免费试用展现强大实力

  • AI芯片初创Groq引领新潮流,LPU芯片免费试用展现强大实力
    AI
  • 随着AI聊天机器人的广泛应用,背后所需的庞大数据运算能力使得AI运算芯片的需求日益旺盛。近期,AI芯片初创公司Groq推出了其LPU(语言处理单元)芯片的免费试用活动,凭借卓越性能在社交媒体上引起了广泛关注。 试用地址:https://wow.groq.com API地址:https://wow.groq.com Gr... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?