awk系列:如何使用awk內置變量
我們將逐漸揭開 awk 功能的神秘面紗,在本節中,我們將介紹 awk 內置built-in變量的概念。你可以在 awk 中使用兩種類型的變量,它們是:用戶自定義user-defined變量和內置變量。
awk 內置變量已經有預先定義的值了,但我們也可以謹慎地修改這些值,awk 內置變量包括:
- FILENAME : 當前輸入文件名稱
- NR : 當前輸入行編號(是指輸入行 1,2,3……等)
- NF : 當前輸入行的字段編號
- OFS : 輸出字段分隔符
- FS : 輸入字段分隔符
- ORS : 輸出記錄分隔符
- RS : 輸入記錄分隔符
讓我們繼續演示一些使用上述 awk 內置變量的方法:
想要讀取當前輸入文件的名稱,你可以使用 FILENAME 內置變量,如下:
- $ awk ' { print FILENAME } ' ~/domains.txt
awk FILENAME 變量
你會看到,每一行都會對應輸出一次文件名,那是你使用 FILENAME 內置變量時 awk 默認的行為。
我們可以使用 NR 來統計一個輸入文件的行數(記錄),謹記,它也會計算空行,正如我們將要在下面的例子中看到的那樣。
當我們使用 cat 命令查看文件 domains.txt 時,會發現它有 14 行文本和 2 個空行:
- $ cat ~/domains.txt
輸出文件內容
- $ awk ' END { print "Number of records in file is: ", NR } ' ~/domains.txt
awk 統計行數
想要統計一條記錄或一行中的字段數,我們可以像下面那樣使用 NR 內置變量:
- $ cat ~/names.txt
列出文件內容
- $ awk '{ "Record:",NR,"has",NF,"fields" ; }' ~/names.txt
awk 統計文件中的字段數
接下來,你也可以使用 FS 內置變量指定一個輸入文件分隔符,它會定義 awk 如何將輸入行劃分成字段。
FS 默認值為“空格”和“制表符”,但我們也能將 FS 值修改為任何字符來讓 awk 根據情況切分輸入行。
有兩種方法可以達到目的:
- ***種方法是使用 FS 內置變量
- 第二種方法是使用 awk 的 -F 選項
來看 Linux 系統上的 /etc/passwd 文件,該文件中的各字段是使用 : 分隔的,因此,當我們想要過濾出某些字段時,可以將: 指定為新的輸入字段分隔符,示例如下:
我們可以使用 -F 選項,如下:
- $ awk -F':' '{ print $1, $4 ;}' /etc/passwd
awk 過濾密碼文件中的各字段
此外,我們也可以利用 FS 內置變量,如下:
- $ awk ' BEGIN { FS=“:” ; } { print $1, $4 ; } ' /etc/passwd
使用 awk 過濾文件中的各字段
使用 OFS 內置變量來指定一個用于輸出的字段分隔符,它會定義如何使用指定的字符分隔輸出字段,示例如下:
- $ awk -F':' ' BEGIN { OFS="==>" ;} { print $1, $4 ;}' /etc/passwd
向文件中的字段添加分隔符
在本節中,我們已經學習了使用含有預定義值的 awk 內置變量的理念。但我們也能夠修改這些值,雖然并不推薦這樣做,除非你明白自己在做什么,并且充分理解(這些變量值)。
此后,我們將繼續學習如何在 awk 命令操作中使用 shell 變量,所以,請繼續關注我們。