谷歌开源基于AI的文件类型识别系统Magika:毫秒级识别内容类型,百万文件测试准确率超 99%

分类:大语言模型 | 热度:37 ℃

谷歌开源了一款名为Magika的AI驱动的文件类型识别系统,这一创新工具旨在帮助广大用户更精确地检测二进制和文本文件类型。Magika的核心在于其定制化的、高度优化的深度学习模型,这个轻量级的模型(仅重约1MB)即使在单个CPU上也能实现毫秒级的精确文件识别。在谷歌内部,Magika已被广泛应用。它通过智能地将Gmail、Drive和安全浏览中的文件引导至相应的安全和内容策略扫描器,显著提升了谷歌用户的安全性。据统计,Magika每周能处理数千亿个文件。与传统的依赖人工规则的系统相比,Magika的文件类型识别准确率提高了惊人的50%。

GitHub地址:https://github.com/google/magika

技术详解:https://opensource.googleblog.com/2024/02/magika-ai-powered-fast-and-efficient-file-type-identification.html

演示地址:https://google.github.io/magika

这一创新工具的亮点在于其出色的准确性和高效性。在涵盖超过100万个文件和100多种内容类型(包括二进制和文本文件格式)的评估中,Magika展现了卓越的性能,准确率和召回率均超过99%。这意味着,无论是普通用户还是企业用户,都能从Magika中受益,享受更快速、更安全的文件处理体验。

谷歌开源基于AI的文件类型识别系统Magika:毫秒级识别内容类型,百万文件测试准确率超 99%

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)! 点此爆料

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论