Linux用戶寶典:借助dupeGuru刪除重復(fù)文件
譯文最近,我接到了任務(wù):清理我父親的文件和文件夾。可是面臨的難題是,里面有大量名稱不正確的重復(fù)文件。由于外部驅(qū)動(dòng)器上有備份,同時(shí)編輯同一個(gè)文件的多個(gè)版本,或者甚至改變目錄結(jié)構(gòu),同一個(gè)文件會(huì)復(fù)制多次、更換名稱、更換位置,完全占用磁盤空間。查明每一個(gè)文件成了異常困難的問題。幸好,有一款小巧的軟件可以找到并刪除你系統(tǒng)上的重復(fù)文件,從而幫助節(jié)省寶貴的時(shí)間,那就是dupeGuru。這個(gè)重復(fù)文件刪除軟件用Python編寫而成,年初換成了GPLv3許可證。所以是時(shí)候用它來清理你的系統(tǒng)了!
dupeGuru的安裝
在Ubuntu上,你可以添加Hardcoded Software個(gè)人程序包存檔(PPA):
- $ sudo apt-add-repository ppa:hsoft/ppa
- $ sudo apt-get update
然后用下列命令安裝:
- $ sudo apt-get install dupeguru-se
在Arch Linux上,該程序在在AUR中(https://aur.archlinux.org/packages/dupeguru-se/)。
如果你喜歡自己編譯,源代碼在GitHub上(https://github.com/hsoft/dupeguru)。
dupeGuru的基本用法
DupeGuru的初衷是既快速又安全。這意味著該程序在系統(tǒng)上運(yùn)行時(shí)不會(huì)亂套。它刪除你不想要?jiǎng)h除的文件的可能性很小。然而,既然我們?nèi)栽谟懻撐募h除,謹(jǐn)小慎微總歸是好主意:做好備份始終必不可少。
一旦你采取了防范措施,就可以通過這個(gè)命令來啟動(dòng)duprGuru了:
- $ dupeguru_se
你應(yīng)該會(huì)看到文件夾選擇畫面,你可以在這里添加想要掃描、以刪除重復(fù)文件的文件夾。
一旦你選擇了目錄并啟動(dòng)掃描,dupeFuru就會(huì)顯示結(jié)果:以列表的形式顯示重復(fù)文件。
請(qǐng)注意:默認(rèn)情況下,dupeGuru根據(jù)文件內(nèi)容、而不是根據(jù)文件名稱來匹配文件。為了確保你沒有誤刪除重要文件,匹配列為你顯示了匹配算法的準(zhǔn)確性。你可以從這里選擇想要執(zhí)行操作的重復(fù)文件,點(diǎn)擊“Action”(操作)按鈕,就可以看到可用的操作。
可以選擇的操作相當(dāng)廣泛。簡而言之,你可以刪除重復(fù)文件、將重復(fù)文件移到另一個(gè)位置、忽略重復(fù)文件、打開重復(fù)文件、重命名重復(fù)文件,或者甚至對(duì)它們執(zhí)行自定義命令。如果你選擇刪除重復(fù)文件,可能會(huì)驚喜地發(fā)現(xiàn)可用的刪除選項(xiàng)。
你不僅可以將重復(fù)文件發(fā)送到垃圾箱或***刪除,還可以選擇留下指向原始文件的鏈接(使用符號(hào)鏈接或硬鏈接)。換句話說,重復(fù)文件會(huì)被刪除,留下的只是原始文件的鏈接,這能省下大量磁盤空間。如果你將那些文件導(dǎo)入到工作空間,或者有基于它們的依賴項(xiàng),這項(xiàng)功能特別有用。
還有一個(gè)奇特的選項(xiàng):你可以將結(jié)果導(dǎo)出到HTML或CSV文件。我并不確信你為什么會(huì)這么做,但我想如果你想要追查重復(fù)文件,而不是對(duì)重復(fù)文件執(zhí)行dupeGuru的任何操作,這很有用。
***但并非最不重要的是,參數(shù)選擇菜單可以讓刪除重復(fù)文件的美夢成真。
這里你可以選擇掃描的標(biāo)準(zhǔn),或基于內(nèi)容,或基于名稱,還有控制結(jié)果數(shù)量的重復(fù)文件閾值。還可以定義你在操作中所能選擇的自定義命令。在眾多的其他小選項(xiàng)當(dāng)中,我們注意到:默認(rèn)情況下,dupeGuru忽略小于10KB的文件。
想了解更多信息,建議訪問官方網(wǎng)站(http://www.hardcoded.net/dupeguru/),那里有許多說明文檔、支持論壇及其他好東西。
總結(jié)一下,只要我要準(zhǔn)備備份數(shù)據(jù)或者釋放部分硬件空間,就會(huì)使用dupeGuru這款可靠的軟件。我發(fā)覺它對(duì)高級(jí)用戶來說功能足夠強(qiáng)大,對(duì)新手來說又界面直觀、易于使用。錦上添花的是:dupeGuru跨平臺(tái),這意味著你還可以在Mac或Windows PC上使用它。如果你有特定的要求,想清理音樂或圖像文件,也不用擔(dān)心,因?yàn)樗袃蓚€(gè)變種:dupeguru-me(http://www.hardcoded.net/dupeguru_me/)和 dupeguru-pe(http://www.hardcoded.net/dupeguru_pe/),它們分別能找到重復(fù)的音軌和圖片。與常規(guī)版本的區(qū)別主要在于,它不僅僅比較文件格式,還考慮到了特定的媒體元數(shù)據(jù),比如質(zhì)量和比特率。
你覺得dupeGuru怎么樣?會(huì)考慮用它嗎?還是說你建議使用什么另外的重復(fù)文件刪除軟件?歡迎留言交流。
原文標(biāo)題:How to deduplicate files on Linux with dupeGuru