Saliency Map計算模型的常見問題及解答
全文共用5個數據庫(這個五個數據都是包含物體的數據庫,該文的重點也是考擦包含物體的數據庫上比較各個模型)。
Human Inter-observer(IO) model:個人理解就是在N個觀測者中,依次抽出一個人的標注結果作為測試,將其他N-1個人的標注結果的集合作為基準,計算這個人與其他人的標注的不一致性。
這篇文章大概回答了以下的一些問題:
問題1:現在的模型是否已經達到最好,還有沒有提升的空間?
答:由于IO模型是所有模型的上界,因為人們通常在標注顯著物體時能達到高度一致。而現有的模型與IO模型在所有數據庫上(該文提出的5個數據庫,以下同)還有很大的差距,所以還有提升空間。
問題2:現有模型的準確性有沒有理論下界?
答:有。將圖像中的所有像素依照均勻分布輸入顯著值,這樣得到的顯著圖計算出來的AUC是0.5,是理論下界。所有的模型的AUC值都大于等于這個值。
問題3:目前模型主要分為哪幾類?
答:目前的方法主要分為兩大類。1)基于注視點預測的模型;2)基于提取和分割顯著物體的模型。平均來說,基于注視點的模型的性能要比基于物體的顯著性的模型差一些。注視點預測的模型中最好的模型要比基于物體的顯著性的模型中最差的要好點。
問題4:為什么兩類模型在便于分割的數據上的性能不同?
答:這個原因在于真陽性和假陽性的個數。分割算法試圖產生白色的顯著區域來包含更多的真陽性。令一方面,注視點預測模型具有很大的選擇性,很少產生假陽性點(因為圖中的注視點比較少)。在分開的獨立的實驗中,在注視點數據庫上注視點預測模型的性能要優于基于分割的模型。
問題5:將現有的模型線性組合起來的結果是否要優于單獨的模型?
答:在每個數據庫上組合最好的模型得到的結果,有可能要優于其他所有的模型。而組合兩個做好的模型得到的結果,與組合最優的三個模型的結果差不多(少一點)。
問題6:圖像中的物體的大小對模型的準確性的是否有影響?
答:在很小的物體上取得較高的準確性確實具有挑戰性。如果一個圖的80%是物體,那么一個模型將整個圖作為顯著圖,將能得到80%的準確率。大多數模型在大尺度物體圖中的準確性都很高。
問題7:人工標注的一致性是否影響模型的準確性?
答:人工標注越一致,模型在其上的準確率越高。
問題8:每個模型是否對同一數據庫中所有的圖都有相似的準確性?
答:每個模型都有自己的最容易處理的圖和最難處理的圖。總的來講:在中心有很生動的物體,而周圍是與之截然不同的背景的圖,是所有模型最容易處理的圖。而最難處理的是那些有復雜紋理背景,物體又包含幾個不同部分的圖,或者包含能引起top-down注意的物體(比如文本,人臉,人體,社交行為,注意力導向以及動物)。
問題9:對顯著圖進行高斯模糊是否對準確性產生影響?
答:高斯模型對準確性能產生輕微的影響,但是他們的定性趨勢以及模型的排序保持一致。
問題10:為什么高斯模型能改變注視點預測模型,但不改變顯著物體檢測模型的準確性?
答:可能的原因有兩個:1)在注視點上存在著不一致性,導致模型的結果通常真正落在注意點上。因此,高斯模型的改良這種結果;2)在顯著物體檢測里,評價指標是個圖像區域里進行計算,而在注視點預測模型里,通常是在眼睛注視點的采樣圖上進行計算。對于前者,高斯模糊只在邊緣處其左右;而對于后者,則同樣能改良模型的結果。
問題11:加入中心偏置是否能提供模型的準確性?
答:所有的數據庫都具有中心偏置屬性。加入中心偏置能提高較差性能的模型,但對于性能較好的模型的作用則相反。
問題12:現有模型的結果之間是否存在著相似性?
答:利用線性相關系數,可能得出,現有的模型之前確實存在相似性。
問題13:模型之間的一致性與人工標注一致性之間存在什么關系?
答:他們之間的關系可以總結為:1)對于那些同時是模型一致性和人工標注一致性的圖,通常是包含很清晰的物體,其背景的顏色與物體的顏色截然不同;2)對于那些同時是人工標注不一致的和模型結果不一致的圖,大多是那些不太容易定義顯著物體的圖。這些圖都有復雜紋理背景,物體又包含幾個不同部分。3)那些模型不一致的圖通常是背景紋理較多較復雜的,而顯著物體與背景的特征形似。4)最后對于那些模型一致而人工不一致的圖,里面的物體通常包含多個部分,并且每個部分的特征都與背景不同。總體而言,對于人工不一致的圖比較少。
原文來自:Ali Borji, Dicky N. Sihite, and Laurent Itti," Salient Object Detection: A Benchmark",
中文原文鏈接:http://www.cnblogs.com/hSheng/archive/2012/12/06/2804385.html