15個值得推薦的開源免費圖像標注工具
圖像標注是向圖像添加標簽或注釋的元數(shù)據(jù),使圖像上的內容具有上下文含義。這個過程在機器學習中具有重要意義,助于在訓練視覺模型過程中準確地識別圖像中的元素。
視覺模型最終的用途也非常廣泛,例如,幫助車輛識別道路上的不同物體或障礙物、通過對醫(yī)學圖像的識別幫助疾病檢測和診斷。
本文主要推薦一些較好的開源免費的圖像標注工具。
1.Makesense.ai
https://github.com/SkalskiP/make-sense
Makesense.ai是一個免費的在線跨平臺工具,用于標記照片,非常適合小型計算機視覺深度學習項目。它簡化了數(shù)據(jù)集的準備,標簽可以以多種格式下載。該應用程序使用TypeScript編寫,基于React/Redux框架開發(fā)。它集成了YOLOv、在COCO數(shù)據(jù)集上預訓練的SSD和PoseNet等先進的AI模型,可以自動化圖像標注。其中AI功能基于TensorFlow.js框架,因為照片不需要傳輸?shù)椒掌鳎纱_保數(shù)據(jù)隱私安全。
2.Labelme
https://github.com/labelmeai/labelme
Labelme是一個基于Python的圖像標注工具,支持各種標注類型,并提供自定義GUI。可以導出VOC和COCO格式的數(shù)據(jù)集,用于語義和實例分割。
功能特征:
- 支持多邊形、矩形、圓形、直線、點和圖像級標志注釋
- 適用于Ubuntu、macOS和Windows
- 標注信息保存為JSON文件
- 高級用法示例
- 將標記分配給整個圖像
- 將標注指定給單個面
3.Xtreme1
https://github.com/xtreme1-io/xtreme1
Xtreme1是一個用于標注多模式訓練數(shù)據(jù)的開源平臺,提高了數(shù)據(jù)注釋、管理和本體管理的效率。其人工智能工具旨在提高2D/3D對象檢測、3D實例分割和激光雷達相機融合項目的效率。
功能特征:
- 支持圖像、3D LiDAR和2D/3D傳感器融合數(shù)據(jù)集的數(shù)據(jù)標注
- 內置預標記和交互式模型支持2D/3D對象檢測、分割和分類
- 可配置的本體中心,用于一般類(具有層次結構)和屬性,用于模型訓練
- 數(shù)據(jù)管理和質量監(jiān)測
- 查找和修復標簽錯誤的工具
- 模型結果可視化以協(xié)助模型評估
- 用于大型語言模型的RLHF(beta版)
- 易于使用Docker或從源代碼安裝
4.Label Studio
https://github.com/HumanSignal/label-studio
Label Studio是一個可用于標記數(shù)據(jù)類型(如:音頻、文本、圖像、視頻和時間序列)的開源工具。
- 它具有友好的用戶界面,可以導出標準化格式的數(shù)據(jù),支持集成機器學習模型,并可針對特定項目進行定制。
- 它基于Apache-2.0開源許可證。
5.LOST
https://github.com/l3p-cv/lost
LOST(Label Object and Save Time)是一個基于Web的圖像協(xié)同標注工具。它提供了預先構建的注釋管道,無需編程知識即可進行即時圖像注釋,但也允許用戶定義注釋管道。
該應用程序是可擴展的,可以輕松連接到外部文件系統(tǒng),如S3 Bucket或Azure Blobstorage。可以在本地或Web服務器上設置,并支持組織建立標簽樹,監(jiān)控標注過程和瀏覽器內標注。
關鍵特征:
- 基于Web的協(xié)同圖像標注框架
- 用于即時圖像注釋的預構建注釋管道
- 自定義的標注管道
- 可擴展的應用
- 輕松連接到外部文件系統(tǒng),如S3 Bucket或Azure Blobstorage
- 在瀏覽器中實現(xiàn)標注過程的可視化
- 可在本地或Web服務器上進行配置
- 支持組織標簽樹
- 監(jiān)控標注過程
- 支持在瀏覽器內標注
- 能夠對半自動標注管道進行建模
- 標注建議生成
- 單圖像標注工具(SIA),用于標注bbox、多邊形、點或線
- 多圖像標注工具(MIA),用于標注整個圖像簇
- 導出標注函數(shù)
- 基于個人和項目的標注統(tǒng)計
- 用于標簽組織的彩色標簽樹
- 查看標注功
- 管道項目進出口
- 管道項目共享
- 集成Jupyter-Lab,輕松開發(fā)流水線
- LDAP集成
- 電子郵件通知
- 可擴展設計,跨多臺機器分布密集型計算過程
6.CVAT
https://github.com/opencv/cvat
CVAT(Computer Vision Annotation Tool )是一種用于視頻和圖像標注的交互式工具,在計算機視覺中廣泛使用。它支持以數(shù)據(jù)為中心的人工智能方法,可以免費在線使用,也可以訂閱其他功能。CVAT也可以私有化安裝,并為高級功能提供企業(yè)支持。
7.Gromit-MPX
https://github.com/bk138/gromit-mpx
Gromit-MPX是一個Unix桌面環(huán)境下的標注工具,用戶可以直接在屏幕上繪制,突出顯示感興趣的點來增強演示文稿。
8.MyVision
https://github.com/OvidijusParsiunas/myvision
MyVision是一個免費的在線圖像標注工具,用于生成計算機視覺的機器學習訓練數(shù)據(jù)。支持繪制邊界框和多邊形,用于對象標注、多邊形操作,并支持各種數(shù)據(jù)集格式。它還支持使用”COCO-SSD”模型進行自動標注,可以在本地操作以確保數(shù)據(jù)隱私安全。
支持的數(shù)據(jù)格式:
功能特征:
- 為對象標注繪制邊界框和多邊形
- 使用要素進行面操作以編輯、移除和添加新點
- 支持各種數(shù)據(jù)集格式
- 支持使用“COCO-SSD”模型自動標注
- 在本地運行以維護數(shù)據(jù)隱私
- 允許導入和繼續(xù)處理現(xiàn)有批注項目
- 可用于將數(shù)據(jù)集從一種格式轉換為另一種格式
9.LabelImg
https://github.com/HumanSignal/labelImg
LabelImg是一個流行的圖像標注工具,目前已加入Label Studio社區(qū),不再積極開發(fā)。Label Studio是一個靈活的開源數(shù)據(jù)標簽工具,適用于各種類型的數(shù)據(jù),包括圖像,文本,音頻,視頻和時間序列數(shù)據(jù)。
LabelImg中的標注信息以PASCAL VOC格式保存,另外,它還支持YOLO和XML格式。
10.Coco Annotator
https://github.com/jsbroks/coco-annotator
COCO Annotator是一個基于Web的高效且多功能的圖像標記工具,旨在為訓練圖像定位和對象檢測創(chuàng)建數(shù)據(jù)集。
它提供的功能包括段標記、對象實例跟蹤以及標記具有斷開連接的可見部分的對象。它通過直觀和可定制的界面以COCO格式存儲和導出注釋。
功能特征:
- 基于We的工具
- 高效和通用的圖像標記
- 專為圖像定位和物體檢測的訓練數(shù)據(jù)創(chuàng)建而設計
- 段標號
- 對象實例跟蹤
- 標記具有斷開的可見部分的對象
- 以COCO格式存儲和導出注釋
- 直觀和可定制的界面
- 允許用戶手動定義圖像中的區(qū)域
- 創(chuàng)建文本說明
- 通過邊界框、遮罩工具或標記點進行對象標記
- 自由形式曲線或多邊形標注
- 直接導出為COCO格式
- 分割對象的
- 添加關鍵點的能力
- 用于數(shù)據(jù)分析的有用API端點
- 導入COCO格式的數(shù)據(jù)集
- 將斷開連接的對象標注為單個實例
- 同時使用任意數(shù)量的標簽標記圖像片段
- 允許為每個實例或對象自定義元數(shù)據(jù)
- 高級選擇工具,如DEXTR、MaskRCNN和Magic Wand
- 用半訓練模型標注圖像
- 使用Google圖像生成數(shù)據(jù)集
- 用戶認證系統(tǒng)
11.Universal Data Tool
https://github.com/UniversalDataTool/universal-data-tool
Universal Data Tool是一個多功能的應用程序,用于編輯和標注圖像、文本、音頻和文檔等數(shù)據(jù)類型。它支持圖像分割、文本分類和音頻轉錄等任務。該工具支持實時協(xié)作,可運行于各種平臺,并支持多種數(shù)據(jù)格式。
12.RectLabel
https://github.com/ryouchinsa/Rectlabel-support
Label是一個離線圖像標注工具,可用于對象檢測和分割。
關鍵特征:
- 使用Segment Anything模型標記面和像素
- 使用Core ML模型自動標記
- 行和詞的自動文本識別
- 使用孔標記面
- 標注三次貝塞爾曲線、線段和點
- 航空影像中面向標簽的邊界框
- 使用骨架標記關鍵點
- 使用畫筆和超像素標記像素
- 快速設置對象、屬性、熱鍵和標簽
- 在圖庫視圖中搜索對象、屬性和圖像名稱
- 導出為COCO、Labelme、COML、YOLO、DOTA和CSV格式
- 導出索引顏色蒙版圖像和灰度蒙版圖像
- 視頻到圖像幀、增強圖像等。
13.OpenLabeling
https://github.com/Cartucho/OpenLabeling
OpenLabeling是一個用于標注圖像和視頻的開源工具。它支持PASCAL VOC和YOLO Darknet等多種格式。
該工具已被用于:深度學習對象檢測模型、用于視覺對象跟蹤的干擾感知Siamese網(wǎng)絡、邊界框跟蹤和用于視頻對象跟蹤的OpenCV跟蹤器。
14.bbox-visualizer
https://github.com/shoumikchow/bbox-visualizer
bbox-visualizer可以幫助用戶在對象周圍繪制邊界框,消除了對標簽定位的復雜數(shù)學計算的需要。它提供了各種可視化類型,用于在識別后標記對象。邊界框點的數(shù)據(jù)格式為:(xmin, ymin, xmax, ymax)。
15.PixelAnnotationTool
https://github.com/abreheret/PixelAnnotationTool
PixelAnnotationTool是一個可以使用OpenCV的分水嶺算法快速手動注釋目錄中圖像的工具。
用戶可以用畫筆手動標記區(qū)域,然后啟動算法。如果初始分割需要校正,用戶可以在錯誤區(qū)域上重新繪制新的區(qū)域標注。