亚洲国产av一区二区三区,久久亚洲春色中文字幕久久久 ,亚洲日产2021三区在线

Linux不常用命令之一 —— awk

Posted on 2009-05-27 22:47 林光炎閱讀(771) 評(píng)論(0) 編輯收藏所屬分類: LINUX

#awk??-F:??'模式??? {動(dòng)作}'??file
1)$ awk??'/yaoshuyin/ {print $3,$2;??print $4,$5}'??emp_names.txt
2)$ awk '/yaoshuyin | cnscn/ {print $3,$2} {print $4,$5}'??emp_names.txt
3)$ awk '$5?????/yaoshuyin | tom/'??emp_names.txt
4)# awk '$0??~??/DBNAME/??{ print $0}'???800hr_db.inc.php???
$DB_DBNAME??="800hr_db";
5)#awk '$0??!~??/DBNAME/??{ print $0}' 800hr_db.inc.php
<?
???$DB_HOSTNAME="10.10.10.206";
???$DB_USERNAME="800hr";
???$DB_PASSWORD="800hr_buildhr_best";
?>

6)#awk??'{FS=":"}??{print $2}'???emp_names.txt

???#awk -F:??'{print $2}'??emp_names.txt

#awk??-F:??-f??awk.prog???file

模式?????是一個(gè)正規(guī)表達(dá)式或由!、||、&&、或由圓括號(hào)分組的幾個(gè)正規(guī)表達(dá)式。正規(guī)式必須由/ ... /括起
????????????/hello/??{print $2, $1}???或??
????????????/hello/ || /none/??{print $1, $2}??或??
????????????!/hello/ {print $1, $2}??或
????????????/^[Hh1]/ {print $1, $2}
????????????/hello/ {
???????????????????????? print $2
???????????????????????? print $1
????????????}

================================================================
#awk函數(shù)
length($2)

BEGIN??? {
?????????????????? print??"Beginning to process??the input data..."
?????????????????? for(s=2;s<6;++s)
?????????????????? {
????????????????????????if(s==4)??continue;
????????????????????????print??"s is now",s
????????????????????}
????????????????????printf???"this is a number %d and a string %s\n",333,"333"
???????????? }

????????????{
?????????????????? s +=$2
?????????????????? print??$2, "length=" length($2), "s =" s
????????????}

END??????{
?????????????????? print "End of the process..."
????????????}

%c??(character)
%d??(decimal)
%o??(octal)
%x??(hexadecimal)
%f??(float)
printf??"one=>%1d<,two=>%2.3f<,three=>%-3d<\n",sss,sss,sss?????# -表示左對(duì)齊

====================================================
awk語(yǔ)句
{
?????????if(s>2??&& s<20 || s==10)
?????????{
??????????????? ++s
??????????????? print s
????????? }

????????? while(s<10)
????????? {
??????????????? s=$1/32.3
??????????????? ++m
???????????}

???????????for(s=0;s<10;++s)
???????????{
??????????????????s=$1/32.3
?????????????????++m
????????????}

}

====================================================

$ df -k | awk '{print $1}'| grep -v "Filesystem"
文件系統(tǒng)
/dev/sda2
/dev/sda1
none

$ df -k | awk '{print $1}'| grep -v "Filesystem" | sed s'/\/dev\///g'
文件系統(tǒng)
sda2
sda1
none

#awk??-f???prog??filename_list

=========================================================
-F字段分隔符
$0??????????????代表整行
$1??????????????第一個(gè)字段
{print??$2, $1}?????????????????輸出時(shí)以，為字段分隔符

在我們使用Linux時(shí)，一些常用的命令，比如ls、date、pwd等（不一一例舉了）不太容易忘記，但是對(duì)于一些不太常用的命令而言，不光光是參數(shù)，就連命令都會(huì)忘記（小弟是做開發(fā)工作的，所以比較容易忘記:D）
讓我們繼續(xù)，開始使用 awk，以了解其工作原理。在命令行中輸入以下命令：
$ awk '{ print }' /etc/passwd
?
您將會(huì)見到 /etc/passwd 文件的內(nèi)容出現(xiàn)在眼前。現(xiàn)在，解釋 awk 做了些什么。調(diào)用 awk 時(shí)，我們指定 /etc/passwd 作為輸入文件。執(zhí)行 awk 時(shí)，它依次對(duì) /etc/passwd 中的每一行執(zhí)行 print 命令。所有輸出都發(fā)送到 stdout，所得到的結(jié)果與與執(zhí)行catting /etc/passwd完全相同。
現(xiàn)在，解釋 { print } 代碼塊。在 awk 中，花括號(hào)用于將幾塊代碼組合到一起，這一點(diǎn)類似于 C 語(yǔ)言。在代碼塊中只有一條 print 命令。在 awk 中，如果只出現(xiàn) print 命令，那么將打印當(dāng)前行的全部?jī)?nèi)容。
這里是另一個(gè) awk 示例，它的作用與上例完全相同：
$ awk '{ print $0 }' /etc/passwd
?

在 awk 中， $0 變量表示整個(gè)當(dāng)前行，所以 print 和 print $0 的作用完全一樣。
如果您愿意，可以創(chuàng)建一個(gè) awk 程序，讓它輸出與輸入數(shù)據(jù)完全無(wú)關(guān)的數(shù)據(jù)。以下是一個(gè)示例：
$ awk '{ print "" }' /etc/passwd
?

只要將 "" 字符串傳遞給 print 命令，它就會(huì)打印空白行。如果測(cè)試該腳本，將會(huì)發(fā)現(xiàn)對(duì)于 /etc/passwd 文件中的每一行，awk 都輸出一個(gè)空白行。再次說明， awk 對(duì)輸入文件中的每一行都執(zhí)行這個(gè)腳本。以下是另一個(gè)示例：
$ awk '{ print "hiya" }' /etc/passwd
?

運(yùn)行這個(gè)腳本將在您的屏幕上寫滿 hiya。:)
?
?

＝＋＝＋＝＋＝＋＝＋＝＋＝＋＝
?
?
多個(gè)字段
awk 非常善于處理分成多個(gè)邏輯字段的文本，而且讓您可以毫不費(fèi)力地引用 awk 腳本中每個(gè)獨(dú)立的字段。以下腳本將打印出您的系統(tǒng)上所有用戶帳戶的列表：
$ awk -F":" '{ print $1 }' /etc/passwd
?

上例中，在調(diào)用 awk 時(shí)，使用 -F 選項(xiàng)來指定 ":" 作為字段分隔符。awk 處理 print $1 命令時(shí)，它會(huì)打印出在輸入文件中每一行中出現(xiàn)的第一個(gè)字段。以下是另一個(gè)示例：

$ awk -F":" '{ print $1 $3 }' /etc/passwd
?

以下是該腳本輸出的摘錄：
halt7
operator11
root0
shutdown6
sync5
bin1
....etc.
?

如您所見，awk 打印出 /etc/passwd 文件的第一和第三個(gè)字段，它們正好分別是用戶名和用戶標(biāo)識(shí)字段。現(xiàn)在，當(dāng)腳本運(yùn)行時(shí)，它并不理想 -- 在兩個(gè)輸出字段之間沒有空格！如果習(xí)慣于使用 bash 或 python 進(jìn)行編程，那么您會(huì)指望 print $1 $3 命令在兩個(gè)字段之間插入空格。然而，當(dāng)兩個(gè)字符串在 awk 程序中彼此相鄰時(shí)，awk 會(huì)連接它們但不在它們之間添加空格。以下命令會(huì)在這兩個(gè)字段中插入空格：

$ awk -F":" '{ print $1 " " $3 }' /etc/passwd
?

以這種方式調(diào)用 print 時(shí)，它將連接 $1 、" " 和 $3 ，創(chuàng)建可讀的輸出。當(dāng)然，如果需要的話，我們還可以插入一些文本標(biāo)簽：

$ awk -F":" '{ print "username: " $1 "\t\tuid:" $3" }' /etc/passwd
?

這將產(chǎn)生以下輸出：
username: halt????????? uid:7
username: operator????? uid:11
username: root????????? uid:0
username: shutdown????? uid:6
username: sync????????? uid:5
username: bin?????????? uid:1
....etc.
?
?
?

＝＋＝＋＝＋＝＋＝＋＝＋＝＋＝
?
?
外部腳本
將腳本作為命令行自變量傳遞給 awk 對(duì)于小的單行程序來說是非常簡(jiǎn)單的，而對(duì)于多行程序，它就比較復(fù)雜。您肯定想要在外部文件中撰寫腳本。然后可以向 awk 傳遞 -f 選項(xiàng)，以向它提供此腳本文件：
$ awk -f myscript.awk myfile.in
?

將腳本放入文本文件還可以讓您使用附加 awk 功能。例如，這個(gè)多行腳本與前面的單行腳本的作用相同，它們都打印出 /etc/passwd 中每一行的第一個(gè)字段：
BEGIN {
??? FS=":"
}
{ print $1 }
?

這兩個(gè)方法的差別在于如何設(shè)置字段分隔符。在這個(gè)腳本中，字段分隔符在代碼自身中指定（通過設(shè)置 FS 變量），而在前一個(gè)示例中，通過在命令行上向 awk 傳遞 -F":" 選項(xiàng)來設(shè)置 FS。通常，最好在腳本自身中設(shè)置字段分隔符，只是因?yàn)檫@表示您可以少輸入一個(gè)命令行自變量。我們將在本文的后面詳細(xì)討論 FS 變量。
?
?

＝＋＝＋＝＋＝＋＝＋＝＋＝＋＝
?
?
BEGIN 和 END 塊
通常，對(duì)于每個(gè)輸入行，awk 都會(huì)執(zhí)行每個(gè)腳本代碼塊一次。然而，在許多編程情況中，可能需要在 awk 開始處理輸入文件中的文本之前執(zhí)行初始化代碼。對(duì)于這種情況，awk 允許您定義一個(gè) BEGIN 塊。我們?cè)谇耙粋€(gè)示例中使用了 BEGIN 塊。因?yàn)?awk 在開始處理輸入文件之前會(huì)執(zhí)行 BEGIN 塊，因此它是初始化 FS（字段分隔符）變量、打印頁(yè)眉或初始化其它在程序中以后會(huì)引用的全局變量的極佳位置。
awk 還提供了另一個(gè)特殊塊，叫作 END 塊。awk 在處理了輸入文件中的所有行之后執(zhí)行這個(gè)塊。通常，END 塊用于執(zhí)行最終計(jì)算或打印應(yīng)該出現(xiàn)在輸出流結(jié)尾的摘要信息。
?
?

＝＋＝＋＝＋＝＋＝＋＝＋＝＋＝
?
?
規(guī)則表達(dá)式和塊
awk 允許使用規(guī)則表達(dá)式，根據(jù)規(guī)則表達(dá)式是否匹配當(dāng)前行來選擇執(zhí)行獨(dú)立代碼塊。以下示例腳本只輸出包含字符序列 foo 的那些行：

/foo/ { print }
?

當(dāng)然，可以使用更復(fù)雜的規(guī)則表達(dá)式。以下腳本將只打印包含浮點(diǎn)數(shù)的行：
/[0-9]+\.[0-9]*/ { print }
?
?
?

＝＋＝＋＝＋＝＋＝＋＝＋＝＋＝
?
?
表達(dá)式和塊
還有許多其它方法可以選擇執(zhí)行代碼塊。我們可以將任意一種布爾表達(dá)式放在一個(gè)代碼塊之前，以控制何時(shí)執(zhí)行某特定塊。僅當(dāng)對(duì)前面的布爾表達(dá)式求值為真時(shí)，awk 才執(zhí)行代碼塊。以下示例腳本輸出將輸出其第一個(gè)字段等于 fred 的所有行中的第三個(gè)字段。如果當(dāng)前行的第一個(gè)字段不等于 fred ，awk 將繼續(xù)處理文件而不對(duì)當(dāng)前行執(zhí)行 print 語(yǔ)句：

$1 == "fred" { print $3 }
?

awk 提供了完整的比較運(yùn)算符集合，包括 "=="、"<"、">"、"<="、">=" 和 "!="。另外，awk 還提供了 "~" 和 "!~" 運(yùn)算符，它們分別表示“匹配”和“不匹配”。它們的用法是在運(yùn)算符左邊指定變量，在右邊指定規(guī)則表達(dá)式。如果某一行的第五個(gè)字段包含字符序列 root ，那么以下示例將只打印這一行中的第三個(gè)字段：

$5 ~ /root/ { print $3 }
?
?
?

＝＋＝＋＝＋＝＋＝＋＝＋＝＋＝
?
?
條件語(yǔ)句
awk 還提供了非常好的類似于 C 語(yǔ)言的 if 語(yǔ)句。如果您愿意，可以使用 if 語(yǔ)句重寫前一個(gè)腳本：

{
??? if ( $5 ~ /root/ ) {
??????? print $3
??? }
}
?

這兩個(gè)腳本的功能完全一樣。第一個(gè)示例中，布爾表達(dá)式放在代碼塊外面。而在第二個(gè)示例中，將對(duì)每一個(gè)輸入行執(zhí)行代碼塊，而且我們使用 if 語(yǔ)句來選擇執(zhí)行 print 命令。這兩個(gè)方法都可以使用，可以選擇最適合腳本其它部分的一種方法。
以下是更復(fù)雜的 awk if 語(yǔ)句示例。可以看到，盡管使用了復(fù)雜、嵌套的條件語(yǔ)句， if 語(yǔ)句看上去仍與相應(yīng)的 C 語(yǔ)言 if 語(yǔ)句一樣：

{
??? if ( $1 == "foo" ) {
??????? if ( $2 == "foo" ) {
??????????? print "uno"
??????? } else {
??????????? print "one"
??????? }
??? } else if ($1 == "bar" ) {
??????? print "two"
??? } else {
??????? print "three"
??? }
}
?

使用 if 語(yǔ)句還可以將代碼：

! /matchme/ { print $1 $3 $4 }
?

轉(zhuǎn)換成：
{??
??? if ( $0 !~ /matchme/ ) {
??????? print $1 $3 $4
??? }
}
?

這兩個(gè)腳本都只輸出不包含 matchme 字符序列的那些行。此外，還可以選擇最適合您的代碼的方法。它們的功能完全相同。
awk 還允許使用布爾運(yùn)算符 "||"（邏輯與）和 "&&"（邏輯或），以便創(chuàng)建更復(fù)雜的布爾表達(dá)式：
( $1 == "foo" ) && ( $2 == "bar" ) { print }
?

這個(gè)示例只打印第一個(gè)字段等于 foo 且第二個(gè)字段等于 bar 的那些行。
?
?

＝＋＝＋＝＋＝＋＝＋＝＋＝＋＝
?
?
數(shù)值變量！
至今，我們不是打印字符串、整行就是特定字段。然而，awk 還允許我們執(zhí)行整數(shù)和浮點(diǎn)運(yùn)算。通過使用數(shù)學(xué)表達(dá)式，可以很方便地編寫計(jì)算文件中空白行數(shù)量的腳本。以下就是這樣一個(gè)腳本：
BEGIN?? { x=0 }
/^$/??? { x=x+1 }
END???? { print "I found " x " blank lines. :)" }
?

在 BEGIN 塊中，將整數(shù)變量 x 初始化成零。然后，awk 每次遇到空白行時(shí)，awk 將執(zhí)行 x=x+1 語(yǔ)句，遞增 x 。處理完所有行之后，執(zhí)行 END 塊，awk 將打印出最終摘要，指出它找到的空白行數(shù)量。
?
?

＝＋＝＋＝＋＝＋＝＋＝＋＝＋＝
?
?
字符串化變量
awk 的優(yōu)點(diǎn)之一就是“簡(jiǎn)單和字符串化”。我認(rèn)為 awk 變量“字符串化”是因?yàn)樗?awk 變量在內(nèi)部都是按字符串形式存儲(chǔ)的。同時(shí)，awk 變量是“簡(jiǎn)單的”，因?yàn)榭梢詫?duì)它執(zhí)行數(shù)學(xué)操作，且只要變量包含有效數(shù)字字符串，awk 會(huì)自動(dòng)處理字符串到數(shù)字的轉(zhuǎn)換步驟。要理解我的觀點(diǎn)，請(qǐng)研究以下這個(gè)示例：
x="1.01"
# We just set x to contain the *string* "1.01"
x=x+1
# We just added one to a *string*
print x
# Incidentally, these are comments :)
?

awk 將輸出：
2.01
?

有趣吧！雖然將字符串值 1.01 賦值給變量 x ，我們?nèi)匀豢梢詫?duì)它加一。但在 bash 和 python 中卻不能這樣做。首先，bash 不支持浮點(diǎn)運(yùn)算。而且，如果 bash 有“字符串化”變量，它們并不“簡(jiǎn)單”；要執(zhí)行任何數(shù)學(xué)操作，bash 要求我們將數(shù)字放到丑陋的 $( ) ) 結(jié)構(gòu)中。如果使用 python，則必須在對(duì) 1.01 字符串執(zhí)行任何數(shù)學(xué)運(yùn)算之前，將它轉(zhuǎn)換成浮點(diǎn)值。雖然這并不困難，但它仍是附加的步驟。如果使用 awk，它是全自動(dòng)的，而那會(huì)使我們的代碼又好又整潔。如果想要對(duì)每個(gè)輸入行的第一個(gè)字段乘方并加一，可以使用以下腳本：
{ print ($1^2)+1 }
?

如果做一個(gè)小實(shí)驗(yàn)，就可以發(fā)現(xiàn)如果某個(gè)特定變量不包含有效數(shù)字，awk 在對(duì)數(shù)學(xué)表達(dá)式求值時(shí)會(huì)將該變量當(dāng)作數(shù)字零處理。
?
?

＝＋＝＋＝＋＝＋＝＋＝＋＝＋＝
?
?
眾多運(yùn)算符
awk 的另一個(gè)優(yōu)點(diǎn)是它有完整的數(shù)學(xué)運(yùn)算符集合。除了標(biāo)準(zhǔn)的加、減、乘、除，awk 還允許使用前面演示過的指數(shù)運(yùn)算符 "^"、模（余數(shù)）運(yùn)算符 "%" 和其它許多從 C 語(yǔ)言中借入的易于使用的賦值操作符。
這些運(yùn)算符包括前后加減（ i++ 、 --foo ）、加／減／乘／除賦值運(yùn)算符（ a+=3 、 b*=2 、 c/=2.2 、 d-=6.2 ）。不僅如此 -- 我們還有易于使用的模／指數(shù)賦值運(yùn)算符（ a^=2 、 b%=4 ）。
?
?

＝＋＝＋＝＋＝＋＝＋＝＋＝＋＝
?
?
字段分隔符
awk 有它自己的特殊變量集合。其中一些允許調(diào)整 awk 的運(yùn)行方式，而其它變量可以被讀取以收集關(guān)于輸入的有用信息。我們已經(jīng)接觸過這些特殊變量中的一個(gè)，F(xiàn)S。前面已經(jīng)提到過，這個(gè)變量讓您可以設(shè)置 awk 要查找的字段之間的字符序列。我們使用 /etc/passwd 作為輸入時(shí)，將 FS 設(shè)置成 ":"。當(dāng)這樣做有問題時(shí)，我們還可以更靈活地使用 FS。
FS 值并沒有被限制為單一字符；可以通過指定任意長(zhǎng)度的字符模式，將它設(shè)置成規(guī)則表達(dá)式。如果正在處理由一個(gè)或多個(gè) tab 分隔的字段，您可能希望按以下方式設(shè)置 FS：
FS="\t+"
?

以上示例中，我們使用特殊 "+" 規(guī)則表達(dá)式字符，它表示“一個(gè)或多個(gè)前一字符”。
如果字段由空格分隔（一個(gè)或多個(gè)空格或 tab），您可能想要將 FS 設(shè)置成以下規(guī)則表達(dá)式：
FS="[[:space:]+]"
?

這個(gè)賦值表達(dá)式也有問題，它并非必要。為什么？因?yàn)槿笔∏闆r下，F(xiàn)S 設(shè)置成單一空格字符，awk 將這解釋成表示“一個(gè)或多個(gè)空格或 tab”。在這個(gè)特殊示例中，缺省 FS 設(shè)置恰恰是您最想要的！
復(fù)雜的規(guī)則表達(dá)式也不成問題。即使您的記錄由單詞 "foo" 分隔，后面跟著三個(gè)數(shù)字，以下規(guī)則表達(dá)式仍允許對(duì)數(shù)據(jù)進(jìn)行正確的分析：
FS="foo[0-9][0-9][0-9]"
?
?
?

＝＋＝＋＝＋＝＋＝＋＝＋＝＋＝
?
?
字段數(shù)量
接著我們要討論的兩個(gè)變量通常并不是需要賦值的，而是用來讀取以獲取關(guān)于輸入的有用信息。第一個(gè)是 NF 變量，也叫做“字段數(shù)量”變量。awk 會(huì)自動(dòng)將該變量設(shè)置成當(dāng)前記錄中的字段數(shù)量。可以使用 NF 變量來只顯示某些輸入行：
NF == 3 { print "this particular record has three fields: " $0 }
?

當(dāng)然，也可以在條件語(yǔ)句中使用 NF 變量，如下：
{??
??? if ( NF > 2 ) {
??????? print $1 " " $2 ":" $3
??? }
}
?
?
?

＝＋＝＋＝＋＝＋＝＋＝＋＝＋＝
?
?
記錄號(hào)
記錄號(hào) (NR) 是另一個(gè)方便的變量。它始終包含當(dāng)前記錄的編號(hào)（awk 將第一個(gè)記錄算作記錄號(hào) 1）。迄今為止，我們已經(jīng)處理了每一行包含一個(gè)記錄的輸入文件。對(duì)于這些情況，NR 還會(huì)告訴您當(dāng)前行號(hào)。然而，當(dāng)我們?cè)诒鞠盗幸院蟛糠种虚_始處理多行記錄時(shí)，就不會(huì)再有這種情況，所以要注意！可以象使用 NF 變量一樣使用 NR 來只打印某些輸入行：
(NR < 10 ) || (NR > 100) { print "We are on record number 1-9 or 101+" }
?

另一個(gè)示例：
{
??? #skip header
??? if ( NR > 10 ) {
??????? print "ok, now for the real information!"
??? }
}
?

JAVA學(xué)習(xí)筆記

隨筆分類(74)

隨筆檔案(104)

最新隨筆

最新評(píng)論

Linux不常用命令之一 —— awk

常用鏈接

java

Linux

oracle

service

soa

svn

uml