十個開源工業檢測數據集匯總
1.天池鋁型材表面缺陷數據集
大賽數據集里有1萬份來自實際生產中有瑕疵的鋁型材監測影像數據,每個影像包含一個或多種瑕疵。供機器學習的樣圖會明確標識影像中所包含的瑕疵類型。
2.Kylberg 紋理數據集
在布匹的實際生產過程中,由于各方面因素的影響,會產生污漬、破洞、毛粒等瑕疵,為保證產品質量,需要對布匹進行瑕疵檢測。布匹疵點檢驗是紡織行業生產和質量管理的重要環節,目前人工檢測易受主觀因素影響,缺乏一致性;并且檢測人員在強光下長時間工作對視力影響極大。
由于布匹疵點種類繁多、形態變化多樣、觀察識別難道大,導致布匹疵點智能檢測是困擾行業多年的技術瓶頸。本數據涵蓋了紡織業中布匹的各類重要瑕疵,每張圖片含一個或多種瑕疵。數據包括包括素色布和花色布兩類,其中,素色布數據約8000張;花色布數據約12000張。
3.東北大學帶鋼表面缺陷數據集
數據集收集了夾雜、劃痕、壓入氧化皮、裂紋、麻點和斑塊6種缺陷,每種缺陷300張,圖像尺寸為200×200。數據集包括分類和目標檢測兩部分,不過目標檢測的標注中有少量錯誤,需要注意。
4.Severstal 帶鋼缺陷數據集
該數據集中提供了四種類型的帶鋼表面缺陷。訓練集共有12568張,測試集5506張。圖像尺寸為1600×256。
5.UCI 帶鋼缺陷數據集
該數據集包含了7種帶鋼缺陷類型。這個數據集不是圖像數據,而是帶鋼缺陷的28種特征數據,可用于機器學習項目。鋼板故障的7種類型:裝飾、Z_劃痕、K_劃痕、污漬、骯臟、顛簸、其他故障。
6.DAGM 2007數據集
該數據集主要針對紋理背景上的雜項缺陷,為較弱監督的訓練數據。包含十個數據集,前六個為訓練數據集,后四個為測試數據集。每個數據集均包含以灰度8位PNG格式保存的1000個“無缺陷”圖像和150個“有缺陷”圖像,每個數據集由不同的紋理模型和缺陷模型生成?!盁o缺陷”圖像顯示的背景紋理沒有缺陷,“無缺陷”圖像的背景紋理上恰好有一個標記的缺陷。所有數據集已隨機分為大小相等的訓練和測試子數據集。弱標簽以橢圓形表示,大致表示缺陷區域。
7.磁瓦缺陷數據集
中國科學院自動所一個課題組收集的數據集,是“Saliency of magnetic tile surface defects”這篇論文的數據集。收集了6種常見磁瓦缺陷的圖像,并做了語義分割的標注。
8.RSDDs鐵軌表面缺陷數據集
RSDDs數據集包含兩種類型的數據集:第一種是從快車道捕獲的I型RSDDs數據集,其中包含67個具有挑戰性的圖像。第二個是從普通/重型運輸軌道捕獲的II型RSDDs數據集,其中包含128個具有挑戰性的圖像。
兩個數據集的每幅圖像至少包含一個缺陷,并且背景復雜且噪聲很大。
RSDDs數據集中的這些缺陷已由一些專業的人類觀察員在軌道表面檢查領域進行了標記。
9.KTH-TIPS 紋理圖像數據集
KTH-TIPS 是一個紋理圖像數據集,在不同的光照、角度和尺度下拍攝的不同材質表面紋理圖片。類型包括砂紙、鋁箔、發泡膠、海綿、燈芯絨、亞麻、棉、黑面包、橙皮和餅干共10類。
10.印刷電路板(PCB)瑕疵數據集
這是一個公共的合成PCB數據集,由北京大學發布,其中包含1386張圖像以及6種缺陷(缺失孔,鼠咬壞,開路,短路,雜散,偽銅),用于檢測,分類和配準任務。