新聞中心
awk是Unix環(huán)境下一種非常好的語(yǔ)言,適合于文本處理和報(bào)表生成,它還有許多精心設(shè)計(jì)的特性,允許進(jìn)行特殊技巧程序設(shè)計(jì)。

術(shù)語(yǔ)鋪墊
在awk的文本處理規(guī)則里,awk將文本文件視為由字段和記錄組成的文本數(shù)據(jù)庫(kù)。默認(rèn)情況下,awk將每一行視為一個(gè)記錄,也就是說(shuō)記錄的分隔符是 ,記錄的分隔符可以通過(guò)內(nèi)置變量RS更改。
在每一個(gè)記錄中,又把記錄分為若干個(gè)字段,即記錄由字段組成,而字段的默認(rèn)分隔符為空格或制表符。
一、基礎(chǔ)用法
和我們平常使用的 Linux 命令一樣, awk 也是遵循著某種格式來(lái)使用,格式如下:
# 使用格式 awk 執(zhí)行的事件 文件
# 例如:
root@jaking-virtual-machine:~# awk '{print $0}' test.txt
My first language:Python
My second language:Shell
My third language:Java
My fourth language:C
其中,print 表示打印,$0 表示一整個(gè)記錄,test.txt 表示一個(gè)文件。所以
awk ‘{print $0}’ test.txt
表示把 test.txt 文件里面的每行記錄都打印出來(lái)。
表示整個(gè)記錄,不過(guò)1, 3…..則表示整個(gè)記錄中的第一個(gè)字段,第二個(gè)字段……。
root@jaking-virtual-machine:~# awk '{print $1}' test.txt
My
My
My
My
root@jaking-virtual-machine:~# awk '{print $2}' test.txt
first
second
third
fourth
root@jaking-virtual-machine:~# awk '{print $3}' test.txt
language:Python
language:Shell
language:Java
language:C
剛才我們說(shuō)字段的默認(rèn)分隔符是空格或者制表符這些,默認(rèn)意味著我們可以自己顯式著指定分隔符。下面我們用“:”來(lái)作為我們的分隔符吧。
root@jaking-virtual-machine:~# awk -F ':' '{print $2}' test.txt
Python
Shell
Java
C
上面我們用參數(shù) -F 指定了我們的分隔符,即如果想要指定字段的分隔符,可以用參數(shù) -F 指定分隔符。
二、條件限制
在打印文本的時(shí)候,我們可以指定一些條件。格式如下:
awk 參數(shù) 條件 要執(zhí)行的動(dòng)作 文件
例如我們指定分隔符為“:”,條件為第二個(gè)字段為”Java”的記錄。
# 打印第二個(gè)字段為”Java”的文本
root@jaking-virtual-machine:~# awk -F ':' '$2 == "Java" {print $2}' test.txt
Java
打印奇數(shù)行的的第二個(gè)字段:
# 打印奇數(shù)行的記錄
root@jaking-virtual-machine:~# awk -F ':' 'NR % 2 == 1 {print $2}' test.txt
Python
Java
其中,NR 是一個(gè)內(nèi)置的變量,表示當(dāng)前正在處理的記錄,即當(dāng)前的記錄是第幾個(gè)記錄。
三、條件語(yǔ)句
和我們平常的編程一樣,awk 也提供了 if, else, while 等這些條件語(yǔ)句。
例如,打印第二個(gè)及其之后的記錄:
root@jaking-virtual-machine:~# awk '{if(NR > 1) print $2}' test.txt
second
third
fourth
注意,上面的字段分隔符是空格了,并且 if 語(yǔ)句是在“{}” 里指定的。
再看一個(gè)例子:
root@jaking-virtual-machine:~# awk '{if($1 # 如果第一個(gè)字段小于“s",則打印第一個(gè)字段,否則打印第二個(gè)字段 My My My My root@jaking-virtual-machine:~# awk '{if($1 > "s") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1 My My My My root@jaking-virtual-machine:~# awk '{if($1 > "l") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1 > "c") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1 > "d") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1 > "p") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1 My My My My root@jaking-virtual-machine:~# awk '{if($3 language:Python language:Shell language:Java language:C root@jaking-virtual-machine:~# awk '{if($2 language:Python second third language:C root@jaking-virtual-machine:~# awk '{if($2 My second third My
四、函數(shù)
awk 提供了一些內(nèi)置函數(shù)來(lái)供我們使用,一下常用的函數(shù)如下:
tolower():字符轉(zhuǎn)為小寫(xiě)。
toupper():字符轉(zhuǎn)為大寫(xiě)
length():返回字符串長(zhǎng)度。
substr():返回子字符串。
sqrt():平方根。
rand():隨機(jī)數(shù)。
root@jaking-virtual-machine:~# awk '{print toupper($1)}' test.txt
MY
MY
MY
MY
root@jaking-virtual-machine:~# awk '{print tolower($1)}' test.txt
my
my
my
my
root@jaking-virtual-machine:~# awk -F ':' '{print toupper($2)}' test.txt
PYTHON
SHELL
JAVA
C
root@jaking-virtual-machine:~# awk -F ':' '{print tolower($2)}' test.txt
python
shell
java
c
五、變量
剛才我們說(shuō) NR 是一個(gè)表示當(dāng)前正在處理的記錄是第幾個(gè)記錄的內(nèi)置變量,常用的內(nèi)置變量如下:
NR:表示當(dāng)前處理的是第幾行
NF:表示當(dāng)前行有多少個(gè)字段
FILENAME:當(dāng)前文件名
FS:字段分隔符,默認(rèn)是空格和制表符。
RS:行分隔符,用于分割每一行,默認(rèn)是換行符。
OFS:輸出字段的分隔符,用于打印時(shí)分隔字段,默認(rèn)為空格。
ORS:輸出記錄的分隔符,用于打印時(shí)分隔記錄,默認(rèn)為換行符。
例如我們要打印每一個(gè)記錄的最后一個(gè)字段,就可以使用變量 NF 了。
root@jaking-virtual-machine:~# awk '{print $NF}' test.txt
language:Python
language:Shell
language:Java
language:C
對(duì)了,剛才那個(gè) NR 的變量也是挺好用的,例如:
root@jaking-virtual-machine:~# awk '{print NR ". " $0}' test.txt
1. My first language:Python
2. My second language:Shell
3. My third language:Java
4. My fourth language:C
當(dāng)前文章:awk的特殊使用方法
網(wǎng)頁(yè)網(wǎng)址:http://m.fisionsoft.com.cn/article/cdjgppi.html


咨詢(xún)
建站咨詢(xún)
