LUD-YOLO:兼顧精度與速度的無人機小目標檢測輕量新方案
1. 一眼概覽
LUD-YOLO 提出了一種基于 YOLOv8 的輕量級小目標檢測網絡,結合自適應多尺度特征融合和稀疏注意力機制,在保持高檢測精度的同時實現高效 UAV 部署。
2. 核心問題
現有 UAV 目標檢測面臨圖像復雜背景、小目標難識別、設備資源受限等問題。如何在有限算力和存儲條件下實現高精度的小目標實時檢測,是本文關注的關鍵挑戰。
3. 技術亮點
- 自適應多尺度特征融合(AFPN):通過自適應空間融合機制強化多層級語義信息交互,緩解特征傳播退化;
- 動態稀疏注意力模塊(C2f-BRA):融合稀疏表達與自注意力,實現長距離上下文建模與計算分配優化;
- 網絡瘦身(Network Slimming):在保持精度的前提下裁剪不敏感卷積通道,實現極致輕量化模型部署。
4. 方法框架
圖片
LUD-YOLO 的結構改進包括三大部分:
? 特征融合改進:在 YOLOv8 的 FPN+PAN 結構中插入 C2→C5 的上采樣通路,構建 AFPN,提升低層細節與高層語義信息融合質量;
? 特征提取增強:在 YOLOv8 的 C2f 模塊中引入 Biform 模塊,通過 Top-k 動態稀疏圖機制實現高效注意力;
? 模型輕量化處理:通過 BN 層 L1 正則剪枝卷積通道,結合微調恢復精度,最終獲得部署友好型檢測模型。
5. 實驗結果速覽
? VisDrone2019 數據集:LUDY-S 的 mAP 達 41.7%,比 YOLOv5-S 提高 3.2%,且參數僅 10.34M;LUDY-N 更是以 2.81M 參數量實現 35.2% mAP,為同類模型中最輕;
? UAVDT 數據集:LUDY-S mAP 達 86.2%,優于 YOLOv8-s 的 83.1%;
? 對比實驗表明:在多種輕量模型中,LUD-YOLO 在 mAP、FPS、模型大小之間取得最佳平衡。
6. 實用價值與應用
LUD-YOLO 適用于無人機在農業巡檢、安防監控、交通執法等實際場景中的邊緣部署需求,尤其在復雜環境中的小目標檢測任務中展現出出色性能與部署價值。
7. 開放問題
? LUD-YOLO 是否可進一步適應少樣本或無標注數據場景?
? 動態稀疏注意力機制是否可遷移至視頻流中的連續目標跟蹤任務?
? 模型剪枝策略是否適用于 Transformer 主干網絡?