AAAI ||透視遮擋迷霧:ADP如何革新行人重識別技術?
摘要
本文旨在解決人體重識別中遮擋問題對匹配的影響。現有方法使用背景作為人工遮擋,并依賴于注意力網絡排除干擾。然而,簡單背景遮擋與現實遮擋之間的顯著差異可能會影響網絡的泛化能力。為此,作者提出了一個基于注意力干擾和雙路徑約束網絡(ADP)的新方法,以增強注意力網絡的泛化能力。首先,為了模仿真實世界中的障礙物,引入了注意力干擾掩模模塊(ADM),該模塊可以生成類似于真實遮擋者的攻擊性噪聲,從而產生更復雜的遮擋形式。其次,為了充分利用這些復雜的遮擋圖像,開發了一個雙路徑約束模塊(DPC),可以通過雙路徑交互從完整圖像中獲得首選監督信息。通過實驗結果表明,ADP比現有方法具有更好的性能。
論文方法
方法描述
該論文提出了一種名為ADP(Attention Disturbance and Dual-Path Constraint Network)的方法,用于處理帶有遮擋的人體識別問題。其主要思想是通過生成人工遮擋圖像來模擬真實場景中的遮擋情況,并利用注意力干擾和雙路徑約束模塊來提高模型性能。
具體來說,該方法使用預訓練的ViT作為骨干網絡提取圖像特征,并使用背景信息作為遮擋區域的載體,生成隨機遮擋位置的遮擋圖像。然后將遮擋圖像與原始圖像一起輸入參數共享的transformer中,以提取它們各自的特征。在transformer中添加一個可學習的類嵌入標記,以聚合圖像信息并充當全局特征圖。此外,在transformer中還添加了一個可學習的位置嵌入,以添加空間信息。
方法改進
該方法引入了注意力干擾機制,通過動態更新遮擋掩模,使網絡的注意力錯誤地集中在遮擋區域上,從而增強模型對于遮擋的魯棒性。同時,通過引入雙路徑約束模塊,將原始圖像和遮擋圖像分別輸入到不同的身份分類器中,增加了模型對于復雜遮擋情況的處理能力。
解決的問題
該方法可以有效地解決帶有遮擋的人體識別問題,尤其是在復雜的遮擋情況下。實驗結果表明,相較于其他方法,該方法在不同數據集上的識別準確率都有所提升。
論文實驗
本文主要介紹了在Re-ID領域中提出的一種新的方法——自適應多路徑網絡(ADP),并進行了廣泛的實驗驗證其有效性。實驗包括兩個部分:一是針對兩種不同類型的Re-ID數據集——occluded和holistic的數據集,對ADP與其他SOTA方法的比較實驗;二是對ADP內部各個模塊的影響進行的ablation實驗。
首先,在occluded數據集上的實驗結果表明,相比于CNN-based方法,Transformer-based方法表現更好,這說明了利用注意力機制對于處理遮擋問題是有益的。具體來說,在最具有挑戰性的Occluded-Duke數據集上,ADP取得了72.2%的rank-1準確率,比transformer-based SOTA方法DPM高出3.1%。此外,通過使用小步滑動窗口設置,提出的ADP*進一步提高了性能,達到了74.5%的rank-1準確率和63.8%的mAP,相比DPM分別提高了2.0%和3.1%。
其次,在holistic數據集上的實驗結果表明,盡管ADP是為了解決遮擋問題而設計的,但它在holistic數據集上的表現也相當不錯。例如,在Market-1501和DukeMTMC-reID數據集上,ADP相對于state-of-the-art方法ISP和VPM分別獲得了0.3%-1.6%和2.6%-7.6%的rank-1準確率提升,以及0.9%-3.1%和8.7%-10.5%的mAP提升。
最后,在ABlation實驗中,作者通過對ADP內部各個模塊的影響進行分析,得出了以下結論:
訓練時使用ADM進行遮擋的圖像可以顯著提高模型性能,相比于基準方法,性能提升了6.5%的rank-1準確率和7.9%的mAP; 在DPC模塊中,采用雙路徑結構和不對稱分類的方法能夠更好地利用不同類型的數據,并且在rank-1準確率和mAP方面分別提高了1.0%和0.5%,同時添加Litr和Ltri等額外連接可以進一步提高性能。 綜上所述,本文提出了一種新的Re-ID方法ADP,并在多個數據集上進行了廣泛的實驗驗證其有效性,證明了該方法在處理遮擋問題和holistic數據集上的優越性。
論文總結
文章優點
該論文提出了一種新的方法來解決人臉識別中的遮擋問題,并且通過實驗驗證了其有效性。該方法采用了攻擊型數據增強策略,模擬真實場景下的遮擋效果,從而提高模型對于遮擋情況的魯棒性。同時,該方法還引入了一個雙路徑約束模塊,使得模型能夠同時處理整張圖像和遮擋后的部分圖像,提高了模型的泛化能力。這些創新性的方法為解決人臉識別中的遮擋問題提供了新的思路和解決方案。
方法創新點
該論文提出了兩個創新性的方法:Attention Disturbance Mask(ADM)和Dual-Path Constraint Module(DPC)。其中,ADM采用了攻擊型數據增強策略,通過產生噪聲掩模來模擬真實場景下的遮擋效果,從而提高模型對于遮擋情況的魯棒性;而DPC則引入了一個雙路徑約束模塊,使得模型能夠同時處理整張圖像和遮擋后的部分圖像,提高了模型的泛化能力。這兩個方法都具有較高的實用性和可擴展性,可以應用于多種不同的人臉識別任務中。
未來展望
該論文提出的Attention Disturbance Mask(ADM)和Dual-Path Constraint Module(DPC)方法在人臉識別領域具有廣泛的應用前景。未來可以通過進一步優化算法實現更高效的訓練過程,并探索更多的應用場景,如視頻監控等領域。此外,還可以結合其他技術手段,如深度學習、機器視覺等,以提高人臉識別系統的性能和可靠性。
本文轉載自 ??AI論文解讀??,作者: 柏企
