成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一行預處理代碼,讓你的CV模型更強

新聞 前端
Google Research提出一個可學習的resizer,只需在預處理部分略作修改,即可提升CV模型性能!

 [[419098]]

圖像預處理的一個重要操作就是resize,把不同大小的圖像縮放到同一尺寸,但目前用到的resize技術仍然是老舊的,無法根據數據變換。Google Research提出一個可學習的resizer,只需在預處理部分略作修改,即可提升CV模型性能!

神經網絡要求輸入的數據的大小在每個mini-batch中是統一的,所以在做視覺任務的時候,一個重要的預處理步驟就是image resize,把它們調整到統一的大小進行訓練。

通常縮放(image down-scaling)后的圖像不會太大,因為如果分辨率過高會導致訓練過程中模型占用的內存急劇上升,并且過高的分辨率也會導致訓練速度和推理速度過慢。雖然近年來GPU的性能逐漸提升,但標準的輸入圖像仍然是224 × 224。

在大多數情況下,經過處理的圖像的最終尺寸非常小,例如早期的deepfake生成的圖片只有80 × 80的分辨率。

[[419099]]

在人臉數據集中,因為人臉很少有是正方形的,一張圖片中的像素會浪費比較多的空間,可用的圖像數據就更少了。

一行預處理代碼,讓你的CV模型更強

目前最常用的圖像大小調整方法包括最近鄰(nearest neighbor)、雙線性(bilinear)和雙三次(bicubic)。這些resize方法的速度很快,可以靈活地集成在訓練和測試框架中。

但這些傳統方法是在深度學習成為視覺識別任務的主流解決方案之前幾十年發展起來的,所以并不是特別適合新時代的深度學習模型。

Google Research提出了一種新的方法,通過改進數據集中的圖像在預處理階段縮放的方式,來提高基于圖像的計算機視覺訓練流程的效率和準確性。

一行預處理代碼,讓你的CV模型更強

圖像大小對任務訓練精度的影響并沒有在模型訓練中受到很大關注。為了提高效率,CV研究人員通常將輸入圖像調整到相對較小的空間分辨率(例如224x224) ,并在此分辨率下進行訓練和推理。

研究人員想到,這些resizer是否限制了訓練網絡的任務性能呢?

一行預處理代碼,讓你的CV模型更強

通過一個簡單的實驗就可以證明當這些傳統的resizer被可學習的resizer替代后,可以顯著提高性能。

傳統的resizer通常可以生成更好的視覺上的縮放圖像,可學習的resizer對人來說可能不是特別容易看清楚。

一行預處理代碼,讓你的CV模型更強

文中提出的resizer模型架構如下圖所示:

一行預處理代碼,讓你的CV模型更強

它主要包括了兩個重要的特性:(1) 雙線性特征調整大小(bilinear feature resizing),以及(2)跳過連接(skip connection),該連接可容納雙線性調整大小的圖像和CNN功能的組合。

第一個特性考慮到以原始分辨率計算的特征與模型的一致性。跳過連接可以簡化學習過程,因為重定大小器模型可以直接將雙線性重定大小的圖像傳遞到基線任務中。

與一般的編碼器-解碼器架構不同,這篇論文中所提出的體系結構允許將圖像大小調整為任何目標大小和縱橫比。并且可學習的resizer性能幾乎不依賴于雙線性重定器的選擇,這意味著它可以直接替換其他現成的方法。

并且這個的resizer模型相對較輕量級,不會向基線任務添加大量可訓練參數,這些CNN明顯小于其他基線模型。

論文中的實驗主要分為三個部分。

1、分類性能。

將使用雙線性調整器訓練的模型和輸出調整分辨率224×224稱為默認基線。結果表明,在224×224分辨率的模型中,性能最好,使用文中提出的resizer訓練的網絡對性能有所提升。

與默認基線相比,DenseNet-121和MobileNet-v2基線分別顯示出最大和最小的增益。對于Inception-v2、DenseNet-121和ResNet-50,提出的resizer的性能優于具有類似雙線性重定器。

一行預處理代碼,讓你的CV模型更強

2、質量評估

研究人員使用3種不同的基線模型對AVA數據集進行訓練。基線模型根據ImageNet上預先訓練的權重進行初始化,并在AVA數據集上進行微調。resizer權重是隨機初始化的。在這組實驗中,使用雙三次resizer為基線方法。通過平均基本真實分數和平均預測分數之間的相關性來衡量性能,相關性的評價采用使用皮爾遜線性相關系數(PLCC)和斯皮爾曼秩相關系數(SRCC)。

與基線模型相比,存在確定性的改進。此外,對于Inception-v2和DenseNet-121型號,文中提出的resizer性能優于雙三次resizer。在更高的失敗率下,對于學習型resizer來說,EfficientNet似乎是一個更難有所提升的基線模型。

一行預處理代碼,讓你的CV模型更強

3、泛化性

首先使用與resizer的默認基線不同的目標基線聯合微調的可學習resizer。然后,度量目標基線在底層任務上的性能。可以觀察到,對大約4個epoch的訓練數據進行微調足以使resizer適應目標模型。這個驗證是一個合理的指標,能夠表明經過訓練的resizer對各種體系結構的通用性如何。

由分類和IQA結果可知,每列顯示resizer模型的初始化檢查點,每行表示一個目標基線。這些結果表明,經過最少次的微調,就可以為一個基線訓練的resizer可以有效地用于開發另一個基線的resizer。

在某些情況下,如DenseNet和MobileNet模型,微調的resizer實際上超過了通過隨機初始化獲得的分類性能。對于IQA的EffectiveNet模型也有同樣的觀察結果。

最后研究人員指出,這些實驗專門針對圖像識別任務進行了優化,并且在測試中,他們的 CNN驅動的可學習的resizer能夠在這類任務中降低錯誤率。

未來也許考慮在其他圖像任務中訓練image resizer。

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2022-02-23 14:37:48

代碼Pythonbug

2015-03-20 14:51:09

Testin云測

2020-08-19 10:30:25

代碼Python多線程

2018-09-19 15:46:51

編程語言Python編譯器

2016-12-02 08:53:18

Python一行代碼

2024-12-17 15:00:00

Python代碼

2021-05-28 07:39:17

SQL代碼操作

2021-06-11 14:15:55

代碼前端項目

2017-04-05 11:10:23

Javascript代碼前端

2020-07-20 09:20:48

代碼geventPython

2020-02-19 15:02:23

代碼開發工具

2023-11-10 09:41:44

Python代碼

2011-07-20 09:11:58

C++

2015-07-30 11:13:24

LinuxShell

2018-10-07 05:27:03

Python代碼機器學習

2021-11-02 16:25:41

Python代碼技巧

2024-11-21 15:48:40

2024-08-08 09:15:08

SQL代碼復制表

2014-02-12 13:43:50

代碼并行任務

2022-04-09 09:11:33

Python
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91精品国产手机 | 日本精品在线观看 | 盗摄精品av一区二区三区 | 超碰在线人人干 | 一本大道久久a久久精二百 国产成人免费在线 | 成人av免费网站 | 久久精品二区亚洲w码 | 国产精品久久久久久吹潮日韩动画 | 国产999精品久久久久久 | 草草草草视频 | 日本天堂视频 | 久久99深爱久久99精品 | 亚洲欧美激情精品一区二区 | 作爱视频免费看 | 欧美黄在线观看 | 91久久精品国产免费一区 | 日本黄色免费视频 | 国产日本精品视频 | 国产精品免费一区二区三区四区 | 在线看片国产精品 | 一级免费视频 | 国产做爰| 在线免费国产视频 | 久久久噜噜噜久久中文字幕色伊伊 | 一区二区三区精品视频 | 黄a在线观看 | 国产亚洲精品久久午夜玫瑰园 | 久久机热| 久久综合成人精品亚洲另类欧美 | 91人人视频在线观看 | 日本久久久久久 | 亚洲免费在线 | 日本一区二区视频 | 亚洲九九精品 | 91精品国产91久久久久久吃药 | 国产98色在线 | 日韩 | 日韩中文字幕 | 成人片免费看 | 日韩国产一区二区三区 | 国产成人一区二区三区 | 日韩精品一区二区三区免费观看 |