成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

1MB的神奇AI,檢測百萬文件,99%的準確率!

人工智能
Magika 是一款新穎的人工智能文件類型檢測工具,依靠最新的深度學習技術提供精確的檢測。它采用了高度優(yōu)化的定制 Keras 模型,該模型僅重約 1MB,即使在單 CPU 上運行,也能在幾毫秒內實現(xiàn)精確的文件識別。

在 Web 開發(fā)中,上傳文件至服務器前的文件類型檢測至關重要。這一步驟不僅能夠確保服務器和用戶的安全,攔截可能的惡意文件,還能保證上傳的文件完整且符合預期,提高數(shù)據(jù)的合規(guī)性。同時,通過及時給予用戶反饋和指導,也能提升用戶體驗,避免不必要的困惑。

之前阿寶哥有介紹過 “JavaScript 如何檢測文件的類型?”,現(xiàn)在我們已經(jīng)進入 AI 時代,要與時俱進。接下來,阿寶哥將介紹如何利用谷歌開源的 Magika[1] 工具,實現(xiàn)精準的文件類型檢測。

圖片圖片

Magika 簡介

Magika 是一款新穎的人工智能文件類型檢測工具,依靠最新的深度學習技術提供精確的檢測。它采用了高度優(yōu)化的定制 Keras 模型,該模型僅重約 1MB,即使在單 CPU 上運行,也能在幾毫秒內實現(xiàn)精確的文件識別。

在對超過 100 萬個文件和超過 100 種內容類型(涵蓋二進制和文本文件格式)的評估中,Magika 實現(xiàn)了 99% 以上的精確度和召回率。Magika 被大規(guī)模使用,通過將 Gmail、云端硬盤和安全瀏覽文件路由到適當?shù)陌踩蛢热莶呗話呙鑳x,來保障 Google 用戶的安全。

Magika 的特點

  • 支持檢測 100 多種文件類型。
  • 支持 Python 命令行、Python API 和實驗性 TFJS 版本等多種使用方式。
  • 模型加載后(這是一次性開銷),每個文件的推理時間約為 5 毫秒。
  • 接近恒定的推理時間,與文件大小無關。Magika 僅使用文件字節(jié)的有限子集。
  • 支持批處理:支持同時向命令行和 API 發(fā)送多個文件,Magika 將使用批處理來加快推理時間。
  • 在包含 100 多種內容類型的超過 2500 萬個文件的數(shù)據(jù)集上進行了訓練。
  • 經(jīng)過大規(guī)模評估,Magika 的平均精確度和召回率達到 99% 以上,優(yōu)于現(xiàn)有方法。
  • Magika 使用每個內容類型的閾值系統(tǒng)來確定是否“信任”模型的預測,或者是否返回通用標簽,例如“通用文本文檔”或“未知二進制數(shù)據(jù)”。
  • 支持三種不同的預測模式,調整對錯誤的容忍度:高置信度、中等置信度和最佳猜測。

Magika 的性能

圖片圖片

性能方面,Magika 憑借其 AI 模型和大型訓練數(shù)據(jù)集,在包含 100 多種文件類型的 1M 文件基準測試上進行評估時,其性能比其他現(xiàn)有工具高出約 20%。按文件類型細分,如下表所示,我們發(fā)現(xiàn)文本文件的性能提升更大,包括其他工具可能難以處理的代碼文件和配置文件。

圖片圖片

Magika 在線示例

Magika 支持瀏覽器和 Node.js 環(huán)境,你可以通過訪問 Web Demo[2] 網(wǎng)站來體驗它的功能。

圖片圖片

Magika 快速上手

安裝 magika

npm install magika
or
pnpm add magika

瀏覽器中使用 magika

import { Magika } from "magika";

const file = new File(["# Hello I am a markdown file"], "hello.md");
const fileBytes = new Uint8Array(await file.arrayBuffer());
const magika = new Magika();
await magika.load();
const prediction = await magika.identifyBytes(fileBytes);
console.log(prediction);

Node.js 中使用 magika

import { readFile } from "fs/promises";
import { MagikaNode as Magika } from "magika";

const data = await readFile("some file");
const magika = new Magika();
await magika.load();
const prediction = await magika.identifyBytes(data);
console.log(prediction);

有關 Magika 的相關內容就介紹到這里,如果你想進一步了解 Magika,可以繼續(xù)閱讀 Magika: AI powered fast and efficient file type identification[3] 這篇文章。

參考資料

[1]Magika: https://github.com/google/magika

[2]Web Demo: https://google.github.io/magika/

[3]Magika: AI powered fast and efficient file type identification: https://opensource.googleblog.com/2024/02/magika-ai-powered-fast-and-efficient-file-type-identification.html

責任編輯:武曉燕 來源: 全棧修仙之路
相關推薦

2023-11-08 08:38:43

2023-07-26 15:13:33

人工智能OpenAI

2022-08-05 14:38:16

機器學習AI

2020-11-20 17:03:11

AI 數(shù)據(jù)人工智能

2023-06-29 17:42:55

AI檢測

2020-10-09 08:31:00

AI

2023-06-08 19:07:17

ChatGPTAI

2024-09-29 16:00:26

2018-11-14 10:01:30

谷歌開源機器學習

2024-01-16 14:00:00

2022-01-10 23:57:36

人工智能語音識別技術

2022-04-13 10:31:04

微軟Jigsaw大型語言模型

2022-09-14 13:30:33

AI手機程序

2023-08-15 14:55:57

2022-09-14 09:55:32

人工智能AI解碼技術

2023-05-04 09:39:16

AI模型

2023-06-21 09:15:30

AI 技術神經(jīng)網(wǎng)絡

2019-10-14 15:13:24

AI 數(shù)據(jù)人工智能

2019-11-20 10:03:56

AI 數(shù)據(jù)人工智能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产视频中文字幕 | 综合久久av | 国产婷婷在线视频 | 亚洲欧美bt | 久久综合一区二区 | 欧美aa在线 | 国产玖玖 | 欧美黄在线观看 | 国产第一页在线播放 | 欧美成视频 | 第一区在线观看免费国语入口 | 国产精品视频久久久 | 一区二区在线 | 一区二区三区视频在线 | 中文字幕av在线一二三区 | 欧美性网 | 2022精品国偷自产免费观看 | 精品久久久久一区二区国产 | 久热伊人 | 日韩视频在线一区 | 黄色片免费看 | 久久午夜精品 | 成人福利网站 | 蜜臀久久 | 国产精品一区二区在线免费观看 | 日本天天操 | 国产午夜精品一区二区三区 | 在线播放第一页 | 国产一级影片 | 欧美人人| 国产你懂的在线观看 | 欧美中文字幕一区二区三区 | 成人免费毛片片v | 亚洲视频中文字幕 | 国产成人精品一区二区三区在线 | 99精品视频在线观看免费播放 | 国产区在线看 | 亚洲精品一区二区网址 | 中文字幕一页二页 | 成人不卡| 日韩免费高清视频 |