超越文本,GPT-4在虹膜生物識別的創新應用
虹膜識別作為識別人類身份的特殊驗證方法,已經在門禁監控、在線支付、飛機場等廣泛應用。但在應用的過程中也面臨一些挑戰。例如,佩戴眼鏡、隱形眼鏡或是虹膜受到部分遮擋等情況可能會干擾虹膜圖像的采集,進而影響識別的準確性。
美國密歇根州立大學的研究人員對GPT-4的虹膜識別能力進行了一系列評估,使用了零樣本學習方法,在各種挑戰條件下對模型進行綜合測試,包括不同的數據集、呈現攻擊、眼鏡遮擋等。
結果顯示,GPT-4對虹膜的識別能力非常優秀,同時在軟生物識別方面也很強,例如,通過觀察虹膜特征,能判斷出使用睫毛膏人的性別等相關識別信息。
研究人員通過利用Python與GPT-4的API設計了實驗參數和提示。這種方法允許以一致、可復制的方式與模型進行交互,同時能夠根據不同實驗的需求輕松調整參數。
在初步實驗中,研究人員從 ND - Iris - 0405 和 IIT - Delhi - Iris 數據集中選取了兩個明顯不同的虹膜圖像,讓 GPT - 4 判斷它們是否屬于同一個人。
起初,系統因倫理考慮而拒絕進行生物識別分析,但通過調整提示,明確查詢的非生物識別性質并尋求GPT 的 意見,GPT - 4 成功參與了任務,并提供了關于虹膜特征和組件的詳細解釋,認為圖像可能代表不同的身份。
隨后增加了實驗的難度,研究人員從 CASIA - Iris - Intervalv3數據集中精心挑選了更為相似的圖像,這些圖像在虹膜的紋理、顏色和形態等特征上的差異極其細微,幾乎達到了肉眼難以分辨的程度。
同時還特意引入了高斯噪聲,這是一種在圖像處理中常見的隨機噪聲,它會使圖像的像素值發生隨機的波動,從而嚴重干擾虹膜圖像的清晰度和準確性。
GPT - 4通過對虹膜特征的精細建模和對噪聲的有效過濾,依然能夠分析虹膜紋理的細微變化、顏色的微妙差異以及形態的微小改動,精準判斷出這些圖像是否屬于同一個虹膜。
在相似性測試實驗中,通過讓GPT - 4 對虹膜圖像進行概率評估并給出相似性評分(0 - 100)和 “是” 或 “否” 的判斷,研究發現盡管眼鏡可能會遮擋虹膜,但 GPT - 4 能夠準確預測匹配,展示了其先進的視覺處理技能和對實際應用中變化和障礙的應對能力。
在 PA 檢測實驗中,GPT - 4 能夠檢測到通過死后虹膜圖像和帶紋理的隱形眼鏡試圖繞過生物識別系統的行為。例如,在使用 Warsaw - vl 死后虹膜數據集的實驗中,GPT - 4 懷疑其中一個圖像是人工偽造的,因為其清晰度非常不自然。
在跨模態匹配實驗中,最初 GPT - 4 在匹配虹膜圖像與面部照片時遇到點困難,但通過將任務重新描述為謎題,并使用眼睛代替虹膜以及引入明顯不同的眼睛顏色時,模型的匹配準確性得到了顯著提高。當圖像數量增加到 12 和 20 時,GPT - 4 能夠始終正確識別匹配,證實了其在該任務中的穩健性。
此外,研究人員還對 谷歌的Gemini 進行了實驗。與GPT - 4 能夠同時處理多個圖像不同,Gemini 一次只能處理一個圖像,這需要使用外部工具將圖像組合成一個文件進行分析,增加了實驗的復雜性并降低了效率。
論文地址:https://arxiv.org/abs/2408.04868
盡管 Gemini 在某些情況下能夠提供準確的響應,但它在保持查詢間的上下文連續性方面存在顯著局限性,與 ChatGPT - 4 相比,在圖像理解和生物識別驗證任務中的 Sophistication和 Userfriendliness 方面還有差距。
本文轉自 AIGC開放社區,作者:AIGC開放社區
