Linux管理員須知:find命令詳解
概述
有時可能需要在系統中查找具有某一特征的文件(例如文件權限、文件屬主、文件長度、文件類型等等)。這樣做可能有很多原因。可能出于安全性的考慮,或是一般性的系統管理任務,或許只是為了找出一個不知保存在什么地方的文件。find一個非常有效的工具,它可以遍歷當前目錄甚至于整個文件系統來查找某些文件或目錄。
由于find具有如此強大的功能,所以它的選項也很多,其中大部分選項都值得我們花時間來了解一下。即使系統中含有網絡文件系統(NFS),find命令在該文件系統中同樣有效,只要你具有相應的權限。
在運行一個非常消耗資源的find命令時,很多人都傾向于把它放在后臺執行,因為遍歷一個大的文件系統可能會花費很長的時間(這里是指30G字節以上的文件系統)。
find命令的使用
find pathname -options [-print -exec -ok]
find命令的一般格式為:
find [-H] [-L] [-P] [path...] [expression]
其中,'-H' '-L' '-P'三個選項主要是用來處理符號連接,'-H'表示只跟隨命令行中指定的符號連接,'-L'表示跟隨所有的符號連接,'-P'是默認的選項,表示不跟隨符號連接。
例如,在我的當前目錄下有一個符號連接e1000,現在我想查找文件名中最后一個字母是數字的源文件,那么
$ find -H . -name "*[0-9].c" -print ./2234.c
像上面這樣寫只能查找出當前目錄下符合要求的文件,卻找不出e1000下的文件。因此可以這么寫:
$ find -H e1000 . -name "*[0-9].c" -print
或者使用 '-L'選項:
$ find -L . -name "*[0-9].c" -print
格式中的[path...]部分表示以此目錄為根目錄進行搜索。
格式中的[expression]是一個表達式。最基本的表達式分為三類:設置項(option)、測試項(test)、動作項(action),這三類又可以通過邏輯運算符(operator)組合在一起形成更大更復雜的表達式。設置項(如-depth,-maxdepth等)針對這次查找任務,而不是僅僅針對某一個文件,設置項總是返回true;測試項(test)則不同,它針對具體的一個文件進行匹配測試,如-name,-num,-user等,返回true或者false;動作項(action)則是對某一個文件進行某種動作(最常見的如-print),返回true或者false。
正是[expression]部分的豐富,才使得find如此強大。此部分較復雜,后面慢慢說明。
find命令選項
find命令有很多選項或表達式,每一個選項前面跟隨一個橫杠-。讓我們先來看一下該命令的主要選項,然后再給出一些例子。
-name 按照文件名查找文件。
-perm 按照文件權限來查找文件。
-prune 使用這一選項可以使f i n d命令不在當前指定的目錄中查找,如果同時使用了-depth選項,那么-prune選項將被find命令忽略。
-user 按照文件屬主來查找文件。
-group 按照文件所屬的組來查找文件。
-mtime -n or +n按照文件的更改時間來查找文件,-n表示文件更改時間距現在n天以內,+n表示文件更改時間距現在n天以前。find命令還有-atime和-ctime選項,但它們都和-mtime選項相似,所以我們在這里只介紹-mtime選項。
-nogroup 查找無有效所屬組的文件,即該文件所屬的組在/etc/groups中不存在。
-nouser 查找無有效屬主的文件,即該文件的屬主在/etc/password中不存在。
-newer file1 ! file2 查找更改時間比文件file1新但比文件file2舊的文件。
-type 查找某一類型的文件,諸如:
b - 塊設備文件。
d - 目錄。
c - 字符設備文件。
p - 管道文件。
l - 符號鏈接文件。
f - 普通文件。
-size n[c] 查找文件長度為n塊的文件,帶有c時表示文件長度以字節計。
-depth 在查找文件時,首先查找當前目錄中的文件,然后再在其子目錄中查找。
-fstype 查找位于某一類型文件系統中的文件,這些文件系統類型通常可以在配置文件/etc/fstab中找到,該配置文件中包含了本系統中有關文件系統的信息。
-mount 在查找文件時不跨越文件系統mount點。
-follow 如果find命令遇到符號鏈接文件,就跟蹤至鏈接所指向的文件。
-cpio 對匹配的文件使用cpio命令,將這些文件備份到磁帶設備中。
使用name選項
文件名選項是find命令最常用的選項,要么單獨使用該選項,要么和其他選項一起使用。可以使用某種文件名模式來匹配文件,記住要用引號將文件名模式引起來。
不管當前路徑是什么,如果想要在自己的根目錄$HOME中查找文件名符合*.txt的文件,使用~作為pathname參數,波浪號~代表了你的$HOME目錄。
$ find ~ -name "*.txt" -print
想要在當前目錄及子目錄中查找所有的‘*.txt’文件,可以用:
$ find . -name "*.txt" -print
想要的當前目錄及子目錄中查找文件名以一個大寫字母開頭的文件,可以用:
$ find . -name "[A-Z]*" -print
想要在/etc目錄中查找文件名以h o s t開頭的文件,可以用:
$ find /etc -name "host*" -print
如果想在當前目錄查找文件名以兩個小寫字母開頭,跟著是兩個數字,最后是* . t x t的文
件,下面的命令就能夠返回名為ax37.txt的文件:
$ find . -name "[a-z][a-z][0--9][0--9].txt" -print
使用perm選項
如果希望按照文件權限模式來查找文件的話,可以采用-perm選項。你可能需要找到所有用戶都具有執行權限的文件,或是希望查看某個用戶目錄下的文件權限類型。在使用這一選項的時候,最好使用八進制的權限表示法。為了在當前目錄下查找文件權限位為7 5 5的文件,即文件屬主可以讀、寫、執行,其他用戶可以讀、執行的文件,可以用:
$ find . -perm 755 -print
使用prune選項
如果在查找文件時希望忽略某個目錄,因為你知道那個目錄中沒有你所要查找的文件,那么可以使用-prune選項來指出需要忽略的目錄。在使用-prune選項時要當心,因為如果你同時使用了-depth選項,那么-prune選項就會被find命令忽略。
如果希望在/apps目錄下查找文件,但不希望在/apps/bin目錄下查找,可以用:
$ find /apps -name "/apps/bin" -prune -o -print
使用user和nouser選項
如果希望按照文件屬主查找文件,可以給出相應的用戶名。例如,在$HOME目錄中查找文件屬主為dave的文件,可以用:
$ find ~ -user dave -print
在/etc目錄下查找文件屬主為uucp的文件:
$ find /etc -user uucp -print
為了查找屬主帳戶已經被刪除的文件,可以使用-nouser選項。這樣就能夠找到那些屬主在/etc/password文件中沒有有效帳戶的文件。在使用-nouser選項時,不必給出用戶名;find命令能夠為你完成相應的工作。例如,希望在/home目錄下查找所有的這類文件,可以用:
$ find /home -nouser -print
使用group和nogroup選項
就像user和nouser選項一樣,針對文件所屬于的用戶組,find命令也具有同樣的選項,為了在/apps目錄下查找屬于accts用戶組的文件,可以用:
$ find /apps -group accts -print
要查找沒有有效所屬用戶組的所有文件,可以使用nogroup選項。下面的find命令從文件系統的根目錄處查找這樣的文件
$ fine / -nogroup -print
按照更改時間查找文件
如果希望按照更改時間來查找文件,可以使用mtime選項。如果系統突然沒有可用空間了,很有可能某一個文件的長度在此期間增長迅速,這時就可以用mtime選項來查找這樣的文件。用減號-來限定更改時間在距今n日以內的文件,而用加號+來限定更改時間在距今n日以前的文件。
希望在系統根目錄下查找更改時間在5日以內的文件,可以用:
$ find / -mtime -5 -print
為了在/var/adm目錄下查找更改時間在3日以前的文件,可以用:
$ find /var/adm -mtime +3 -print
使用newer選項
如果希望查找更改時間比某個文件新但比另一個文件舊的所有文件,可以使用-newer選項。它的一般形式為:
newest_file_name ! oldest_file_name
其中,!是邏輯非符號。這里有兩個文件,它們的更改時間大約相差兩天。
下面給出的find命令能夠查找更改時間比文件age.awk新但比文件belts.awk舊的文件:
$find . -newer age.awk ! -newer belts.awk -exec ls -l {} \;
如果想使用find命令的這一選項來查找更改時間在兩個小時以內的文件,除非有一個現成的文件其更改時間恰好在兩個小時以前,否則就沒有可用來比較更改時間的文件。為了解決這一問題,可以首先創建一個文件并將其日期和時間戳設置為所需要的時間。這可以用touch命令來實現。
假設現在的時間是2 3 : 4 0,希望查找更改時間在兩個小時以內的文件,可以首先創建這樣一個文件:
$touch -t 05042140 dstamp
一個符合要求的文件已經被創建;這里我們假設今天是五月四日,而該文件的更改時間是21:40,比現在剛好早兩個小時。
現在我們就可以使用find命令的-newer選項在當前目錄下查找所有更改時間在兩個小時以內的文件:
$ find . -newer dstamp -print
使用type選項
Unix或Linux系統中有若干種不同的文件類型,這部分內容我們在前面的章節已經做了。
如果要在/etc目錄下查找所有的目錄,可以用:
$ find /etc -type d -print
為了在當前目錄下查找除目錄以外的所有類型的文件,可以用:
$ find . ! -type d -print
為了在/etc目錄下查找所有的符號鏈接文件,可以用:
$ find /etc -type l -print
使用size選項
可以按照文件長度來查找文件,這里所指的文件長度既可以用塊(block)來計量,也可以用字節來計量。以字節計量文件長度的表達形式為N c;以塊計量文件長度只用數字表示即可。就我個人而言,我總是使用以字節計的方式,在按照文件長度查找文件時,大多數人都喜歡使用這種以字節表示的文件長度,而不用塊的數目來表示,除非是在查看文件系統的大小,因為這時使用塊來計量更容易轉換。
為了在當前目錄下查找文件長度大于1 M字節的文件,可以用:
$ find . -size +1000000c -print
為了在/home/apache目錄下查找文件長度恰好為1 0 0字節的文件,可以用:
$ find /home/apache -size 100c -print
為了在當前目錄下查找長度超過1 0塊的文件(一塊等于5 1 2字節),可以用:
$ find . -size +10 -print
使用depth選項
在使用find命令時,可能希望先匹配所有的文件,再在子目錄中查找。使用depth選項就可以使find命令這樣做。這樣做的一個原因就是,當在使用find命令向磁帶上備份文件系統時,希望首先備份所有的文件,其次再備份子目錄中的文件。
在下面的例子中,find命令從文件系統的根目錄開始,查找一個名為CON.FILE的文件。
它將首先匹配所有的文件然后再進入子目錄中查找。
$ find / -name "CON.FILE" -depth -print
使用mount選項
在當前的文件系統中查找文件(不進入其他文件系統),可以使用f i n d命令的m o u n t選項。
在下面的例子中,我們從當前目錄開始查找位于本文件系統中文件名以X C結尾的文件:
$ find . -name "*.XC" -mount -print
使用cpio選項
cpio命令可以用來向磁帶設備備份文件或從中恢復文件。可以使用find命令在整個文件系統中(更多的情況下是在部分文件系統中)查找文件,然后用cpio命令將其備份到磁帶上。如果希望使用cpio命令備份/etc/、/home/和/apps目錄中的文件,可以使用下面所給出的命令,不過要記住你是在文件系統的根目錄下:
$cd / $find etc home apps -depth -print | cpio -ivcdC65536 -o /dev/rmt0
(在上面的例子中,第一行末尾的\告訴shell命令還未結束,忽略\后面的回車。)
在上面的例子中,應當注意到路徑中缺少/,這叫作相對路徑。之所以使用相對路徑,是因為在從磁帶中恢復這些文件的時候,可以選擇恢復文件的路徑。例如,可以將這些文件先恢復到另外一個目錄中,對它們進行某些操作后,再恢復到原始目錄中。如果在備份時使用了絕對路徑,例如/etc,那么在恢復時,就只能恢復到/ etc目錄中去,別無其他選擇。在上面的例子中,我告訴find命令首先進入/etc目錄,然后是/home和/apps目錄,先匹配這些目錄下的文件,然后再匹配其子目錄中的文件,所有這些結果將通過管道傳遞給cpio命令進行備份。順便說一下,在上面的例子中cpio命令使用了C65536選項,我本可以使用B選項,不過這樣每塊的大小只有5 1 2字節,而使用了C65536選項后,塊的大小變成了64K字節(65536 /1024)。
使用exec或ok來執行shell命令
當匹配到一些文件以后,可能希望對其進行某些操作,這時就可以使用-exec選項。
-exec選項讓find命令對匹配的文件執行該參數所給出的shell命令。相應命令的形式為' command' {} \;,注意{ }和\;之間的空格。-ok和-exec的作用相同,只不過以一種更為安全的模式來執行該參數所給出的shell命令,在執行每一個命令之前,都會給出提示,讓用戶來確定是否執行。一旦find命令匹配到了相應的文件,就可以用-exec項中的命令對其進行操作(在有些操作系統中只允許-exec選項執行諸如l s或ls -l這樣的命令)。大多數用戶使用這一選項是為了查找舊文件并刪除它們。這里我強烈地建議你在真正執行rm命令刪除文件之前,最好先用ls命令看一下,確認它們是所要刪除的文件。
為了使用exec選項,必須要同時使用print選項。如果驗證一下find命令,會發現該命令只輸出從當前路徑起的相對路徑及文件名。
為了用ls -l命令列出所匹配到的文件,可以把ls -l命令放在find命令的-exec選項中,例如:
$find . -type f -exec ls -l {} \;
上面的例子中,find命令匹配到了當前目錄下的所有普通文件,并在-exec選項中使用ls -l命令將它們列出。
為了在/logs目錄中查找更改時間在5日以前的文件并刪除它們,可以用:
$ find logs -type f -mtime +5 -exec rm {} \;
記住,在shell中用任何方式刪除文件之前,應當先查看相應的文件,一定要小心!當使用諸如mv或rm命令時,可以使用-exec選項的安全模式。它將在對每個匹配到的文件進行操作之前提示你。在下面的例子中,find命令在當前目錄中查找所有文件名以. LOG結尾、更改時間在5日以上的文件,并刪除它們,只不過在刪除之前先給出提示。
按y鍵刪除文件,按n鍵不刪除。
任何形式的命令都可以在-exec選項中使用。在下面的例子中我們使用grep命令。find命令首先匹配所有文件名為“password*”的文件,例如password,password.old,password.bak,然后執行grep命令看看在這些文件中是否存在一個rounder用戶。
$find /etc -name "password*" -exec grep "rounder" {} \; find和xargs
在使用find命令的-exec選項處理匹配到的文件時,find命令將所有匹配到的文件一起傳遞給exec執行。不幸的是,有些系統對能夠傳遞給exec的命令長度有限制,這樣在find命令運行幾分鐘之后,就會出現溢出錯誤。錯誤信息通常是“參數列太長”或“參數列溢出”。這就是xargs命令的用處所在,特別是與find命令一起使用。find命令把匹配到的文件傳遞給xargs命令,而x a rg s命令每次只獲取一部分文件而不是全部,不像-exec選項那樣。這樣它可以先處理最先獲取的一部分文件,然后是下一批,并如此繼續下去。在有些系統中,使用-exec選項會為處理每一個匹配到的文件而發起一個相應的進程,并非將匹配到的文件全部作為參數一次執行;這樣在有些情況下就會出現進程過多,系統性能下降的問題,因而效率不高;而使用xargs命令則只有一個進程。另外,在使用xargs命令時,究竟是一次獲取所有的參數,還是分批取得參數,以及每一次獲取參數的數目都會根據該命令的選項及系統內核中相應的可調參數來確定。
下面的例子查找系統中的每一個普通文件,然后使用xargs命令來測試它們分別屬于哪類文件:下面的例子在整個系統中查找內存信息轉儲文件 (core dump),然后把結果保存到/tmp/core.log 文件中:
$ find . -name "core" -print | xargs echo "" >/tmp/core.log
下面的例子在/apps/audit目錄下查找所有用戶具有讀、寫和執行權限的文件,并收回相應的寫權限:
$ find /apps/audit -perm -7 -print | xargs chmod o-w
在下面的例子中,我們用g r e p命令在所有的普通文件中搜索device這個詞:
$ find / -type f -print | xargs grep "device"
在下面的例子中,我們用grep命令在當前目錄下的所有普通文件中搜索DBO這個詞:
$ find . -name \* -type f -print | xargs grep "DBO"
注意,在上面的例子中,\用來取消f i n d命令中的*在s h e l l中的特殊含義。
參考至:《LINUX與UNIX SHELL編程指南》
http://blog.csdn.net/jakee304/article/details/1792830
http://tech.ddvip.com/2008-09/122069016161378.html