谷歌开源了一款名为Magika的AI驱动的文件类型识别系统,这一创新工具旨在帮助广大用户更精确地检测二进制和文本文件类型。Magika的核心在于其定制化的、高度优化的深度学习模型,这个轻量级的模型(仅重约1MB)即使在单个CPU上也能实现毫秒级的精确文件识别。在谷歌内部,Magika已被广泛应用。它通过智能地将Gmail、Drive和安全浏览中的文件引导至相应的安全和内容策略扫描器,显著提升了谷歌用户的安全性。据统计,Magika每周能处理数千亿个文件。与传统的依赖人工规则的系统相比,Magika的文件类型识别准确率提高了惊人的50%。
GitHub地址:https://github.com/google/magika
演示地址:https://google.github.io/magika
这一创新工具的亮点在于其出色的准确性和高效性。在涵盖超过100万个文件和100多种内容类型(包括二进制和文本文件格式)的评估中,Magika展现了卓越的性能,准确率和召回率均超过99%。这意味着,无论是普通用户还是企业用户,都能从Magika中受益,享受更快速、更安全的文件处理体验。
0条评论