linux中的awk命令怎么處理文本文件的
Linux中的awk是一種處理文本文件的語言,通過不同的參數(shù)和正則表達(dá)式能處理不同類型數(shù)據(jù),對文本分析有重要作用,那么具體參數(shù)選項用法是怎樣的呢?下面由學(xué)習(xí)啦小編為大家整理了linux的awk命令的相關(guān)知識,希望對大家有幫助!
linux中的awk命令詳解
語法
awk [選項參數(shù)] 'script' var=value file(s)
或
awk [選項參數(shù)] -f scriptfile var=value file(s)
選項參數(shù)說明:
-F fs or --field-separator fs
指定輸入文件折分隔符,fs是一個字符串或者是一個正則表達(dá)式,如-F:。
-v var=value or --asign var=value
賦值一個用戶定義變量。
-f scripfile or --file scriptfile
從腳本文件中讀取awk命令。
-mf nnn and -mr nnn
對nnn值設(shè)置內(nèi)在限制,-mf選項限制分配給nnn的最大塊數(shù)目;-mr選項限制記錄的最大數(shù)目。這兩個功能是Bell實驗室版awk的擴展功能,在標(biāo)準(zhǔn)awk中不適用。
-W compact or --compat, -W traditional or --traditional
在兼容模式下運行awk。所以gawk的行為和標(biāo)準(zhǔn)的awk完全一樣,所有的awk擴展都被忽略。
-W copyleft or --copyleft, -W copyright or --copyright
打印簡短的版權(quán)信息。
-W help or --help, -W usage or --usage
打印全部awk選項和每個選項的簡短說明。
-W lint or --lint
打印不能向傳統(tǒng)unix平臺移植的結(jié)構(gòu)的警告。
-W lint-old or --lint-old
打印關(guān)于不能向傳統(tǒng)unix平臺移植的結(jié)構(gòu)的警告。
-W posix
打開兼容模式。但有以下限制,不識別:/x、函數(shù)關(guān)鍵字、func、換碼序列以及當(dāng)fs是一個空格時,將新行作為一個域分隔符;操作符**和**=不能代替^和^=;fflush無效。
-W re-interval or --re-inerval
允許間隔正則表達(dá)式的使用,參考(grep中的Posix字符類),如括號表達(dá)式[[:alpha:]]。
-W source program-text or --source program-text
使用program-text作為源代碼,可與-f命令混用。
-W version or --version
打印bug報告信息的版本。
補充:Linux基礎(chǔ)實用命令
1、cd命令
這是一個非?;?,也是大家經(jīng)常需要使用的命令,它用于切換當(dāng)前目錄,它的參數(shù)是要切換到的目錄的路徑,可以是絕對路徑,也可以是相對路徑。
2、ls命令
這是一個非常有用的查看文件與目錄的命令,list之意,它的參數(shù)非常多,下面就列出一些我常用的參數(shù)吧,如下:
-l :列出長數(shù)據(jù)串,包含文件的屬性與權(quán)限數(shù)據(jù)等
-a :列出全部的文件,連同隱藏文件(開頭為.的文件)一起列出來(常用)
-d :僅列出目錄本身,而不是列出目錄的文件數(shù)據(jù)
-h :將文件容量以較易讀的方式(GB,kB等)列出來
-R :連同子目錄的內(nèi)容一起列出(遞歸列出),等于該目錄下的所有文件都會顯示出來
3、grep命令
該命令常用于分析一行的信息,若當(dāng)中有我們所需要的信息,就將該行顯示出來,該命令通常與管道命令一起使用,用于對一些命令的輸出進(jìn)行篩選加工等等,它的簡單語法為
grep [-acinv] [--color=auto] '查找字符串' filename
它的常用參數(shù)如下:
-a :將binary文件以text文件的方式查找數(shù)據(jù)
-c :計算找到‘查找字符串’的次數(shù)
-i :忽略大小寫的區(qū)別,即把大小寫視為相同
-v :反向選擇,即顯示出沒有‘查找字符串’內(nèi)容的那一行
# 例如:
# 取出文件/etc/man.config中包含MANPATH的行,并把找到的關(guān)鍵字加上顏色
grep --color=auto 'MANPATH' /etc/man.config
# 把ls -l的輸出中包含字母file(不區(qū)分大小寫)的內(nèi)容輸出
ls -l | grep -i file
4、find命令
find是一個基于查找的功能非常強大的命令,相對而言,它的使用也相對較為復(fù)雜,參數(shù)也比較多,所以在這里將給把它們分類列出,它的基本語法如下:
find [PATH] [option] [action]
# 與時間有關(guān)的參數(shù):
-mtime n : n為數(shù)字,意思為在n天之前的“一天內(nèi)”被更改過的文件;
-mtime +n : 列出在n天之前(不含n天本身)被更改過的文件名;
-mtime -n : 列出在n天之內(nèi)(含n天本身)被更改過的文件名;
-newer file : 列出比file還要新的文件名
# 例如:
find /root -mtime 0 # 在當(dāng)前目錄下查找今天之內(nèi)有改動的文件
# 與用戶或用戶組名有關(guān)的參數(shù):
-user name : 列出文件所有者為name的文件
-group name : 列出文件所屬用戶組為name的文件
-uid n : 列出文件所有者為用戶ID為n的文件
-gid n : 列出文件所屬用戶組為用戶組ID為n的文件
# 例如:
find /home/ljianhui -user ljianhui # 在目錄/home/ljianhui中找出所有者為ljianhui的文件
# 與文件權(quán)限及名稱有關(guān)的參數(shù):
-name filename :找出文件名為filename的文件
-size [+-]SIZE :找出比SIZE還要大(+)或小(-)的文件
-tpye TYPE :查找文件的類型為TYPE的文件,TYPE的值主要有:一般文件(f)、設(shè)備文件(b、c)、
目錄(d)、連接文件(l)、socket(s)、FIFO管道文件(p);
-perm mode :查找文件權(quán)限剛好等于mode的文件,mode用數(shù)字表示,如0755;
-perm -mode :查找文件權(quán)限必須要全部包括mode權(quán)限的文件,mode用數(shù)字表示
-perm +mode :查找文件權(quán)限包含任一mode的權(quán)限的文件,mode用數(shù)字表示
# 例如:
find / -name passwd # 查找文件名為passwd的文件
find . -perm 0755 # 查找當(dāng)前目錄中文件權(quán)限的0755的文件
find . -size +12k # 查找當(dāng)前目錄中大于12KB的文件,注意c表示byte
5、cp命令
該命令用于復(fù)制文件,copy之意,它還可以把多個文件一次性地復(fù)制到一個目錄下,它的常用參數(shù)如下:
-a :將文件的特性一起復(fù)制
-p :連同文件的屬性一起復(fù)制,而非使用默認(rèn)方式,與-a相似,常用于備份
-i :若目標(biāo)文件已經(jīng)存在時,在覆蓋時會先詢問操作的進(jìn)行
-r :遞歸持續(xù)復(fù)制,用于目錄的復(fù)制行為
-u :目標(biāo)文件與源文件有差異時才會復(fù)制
6、mv命令
該命令用于移動文件、目錄或更名,move之意,它的常用參數(shù)如下:
-f :force強制的意思,如果目標(biāo)文件已經(jīng)存在,不會詢問而直接覆蓋
-i :若目標(biāo)文件已經(jīng)存在,就會詢問是否覆蓋
-u :若目標(biāo)文件已經(jīng)存在,且比目標(biāo)文件新,才會更新
注:該命令可以把一個文件或多個文件一次移動一個文件夾中,但是最后一個目標(biāo)文件一定要是“目錄”。
例如:
mv file1 file2 file3 dir # 把文件file1、file2、file3移動到目錄dir中
mv file1 file2 # 把文件file1重命名為file2
7、rm命令
該命令用于刪除文件或目錄,remove之間,它的常用參數(shù)如下:
-f :就是force的意思,忽略不存在的文件,不會出現(xiàn)警告消息
-i :互動模式,在刪除前會詢問用戶是否操作
-r :遞歸刪除,最常用于目錄刪除,它是一個非常危險的參數(shù)
例如:
rm -i file # 刪除文件file,在刪除之前會詢問是否進(jìn)行該操作
rm -fr dir # 強制刪除目錄dir中的所有文件
8、ps命令
該命令用于將某個時間點的進(jìn)程運行情況選取下來并輸出,process之意,它的常用參數(shù)如下:
-A :所有的進(jìn)程均顯示出來
-a :不與terminal有關(guān)的所有進(jìn)程
-u :有效用戶的相關(guān)進(jìn)程
-x :一般與a參數(shù)一起使用,可列出較完整的信息
-l :較長,較詳細(xì)地將PID的信息列出
其實我們只要記住ps一般使用的命令參數(shù)搭配即可,它們并不多,如下:
ps aux # 查看系統(tǒng)所有的進(jìn)程數(shù)據(jù)
ps ax # 查看不與terminal有關(guān)的所有進(jìn)程
ps -lA # 查看系統(tǒng)所有的進(jìn)程數(shù)據(jù)
ps axjf # 查看連同一部分進(jìn)程樹狀態(tài)
9、kill命令
該命令用于向某個工作(%jobnumber)或者是某個PID(數(shù)字)傳送一個信號,它通常與ps和jobs命令一起使用,它的基本語法如下:
kill -signal PID
signal的常用參數(shù)如下:
注:最前面的數(shù)字為信號的代號,使用時可以用代號代替相應(yīng)的信號。
1:SIGHUP,啟動被終止的進(jìn)程
2:SIGINT,相當(dāng)于輸入ctrl+c,中斷一個程序的進(jìn)行
9:SIGKILL,強制中斷一個進(jìn)程的進(jìn)行
15:SIGTERM,以正常的結(jié)束進(jìn)程方式來終止進(jìn)程
17:SIGSTOP,相當(dāng)于輸入ctrl+z,暫停一個進(jìn)程的進(jìn)行
例如:
# 以正常的結(jié)束進(jìn)程方式來終于第一個后臺工作,可用jobs命令查看后臺中的第一個工作進(jìn)程
kill -SIGTERM %1
# 重新改動進(jìn)程ID為PID的進(jìn)程,PID可用ps命令通過管道命令加上grep命令進(jìn)行篩選獲得
kill -SIGHUP PID
10、killall命令
該命令用于向一個命令啟動的進(jìn)程發(fā)送一個信號,它的一般語法如下:
killall [-iIe] [command name]
它的參數(shù)如下:
-i :交互式的意思,若需要刪除時,會詢問用戶
-e :表示后面接的command name要一致,但command name不能超過15個字符
-I :命令名稱忽略大小寫
# 例如:
killall -SIGHUP syslogd # 重新啟動syslogd
11、file命令
該命令用于判斷接在file命令后的文件的基本數(shù)據(jù),因為在Linux下文件的類型并不是以后綴為分的,所以這個命令對我們來說就很有用了,它的用法非常簡單,基本語法如下:
file filename
#例如:
file ./test
12、tar命令
該命令用于對文件進(jìn)行打包,默認(rèn)情況并不會壓縮,如果指定了相應(yīng)的參數(shù),它還會調(diào)用相應(yīng)的壓縮程序(如gzip和bzip等)進(jìn)行壓縮和解壓。它的常用參數(shù)如下:
-c :新建打包文件
-t :查看打包文件的內(nèi)容含有哪些文件名
-x :解打包或解壓縮的功能,可以搭配-C(大寫)指定解壓的目錄,注意-c,-t,-x不能同時出現(xiàn)在同一條命令中
-j :通過bzip2的支持進(jìn)行壓縮/解壓縮
-z :通過gzip的支持進(jìn)行壓縮/解壓縮
-v :在壓縮/解壓縮過程中,將正在處理的文件名顯示出來
-f filename :filename為要處理的文件
-C dir :指定壓縮/解壓縮的目錄dir
13、cat命令
該命令用于查看文本文件的內(nèi)容,后接要查看的文件名,通??捎霉艿琅cmore和less一起使用,從而可以一頁頁地查看數(shù)據(jù)。例如:
cat text | less # 查看text文件中的內(nèi)容
# 注:這條命令也可以使用less text來代替
14、chgrp命令
該命令用于改變文件所屬用戶組,它的使用非常簡單,它的基本用法如下:
chgrp [-R] dirname/filename
-R :進(jìn)行遞歸的持續(xù)對所有文件和子目錄更改
# 例如:
chgrp users -R ./dir # 遞歸地把dir目錄下中的所有文件和子目錄下所有文件的用戶組修改為users
15、chown命令
該命令用于改變文件的所有者,與chgrp命令的使用方法相同,只是修改的文件屬性不同,不再詳述。
16、chmod命令
該命令用于改變文件的權(quán)限,一般的用法如下:
chmod [-R] xyz 文件或目錄
-R:進(jìn)行遞歸的持續(xù)更改,即連同子目錄下的所有文件都會更改
同時,chmod還可以使用u(user)、g(group)、o(other)、a(all)和+(加入)、-(刪除)、=(設(shè)置)跟rwx搭配來對文件的權(quán)限進(jìn)行更改。
# 例如:
chmod 0755 file # 把file的文件權(quán)限改變?yōu)?rxwr-xr-x
chmod g+w file # 向file的文件權(quán)限中加入用戶組可寫權(quán)限
18、vim命令
該命令主要用于文本編輯,它接一個或多個文件名作為參數(shù),如果文件存在就打開,如果文件不存在就以該文件名創(chuàng)建一個文件。vim是一個非常好用的文本編輯器,它里面有很多非常好用的命令,在這里不再多說。你可以從這里下載vim常用操作的詳細(xì)說明。
19、gcc命令
對于一個用Linux開發(fā)C程序的人來說,這個命令就非常重要了,它用于把C語言的源程序文件,編譯成可執(zhí)行程序,由于g++的很多參數(shù)跟它非常相似,所以這里只介紹gcc的參數(shù),它的常用參數(shù)如下:
-o :output之意,用于指定生成一個可執(zhí)行文件的文件名
-c :用于把源文件生成目標(biāo)文件(.o),并阻止編譯器創(chuàng)建一個完整的程序
-I :增加編譯時搜索頭文件的路徑
-L :增加編譯時搜索靜態(tài)連接庫的路徑
-S :把源文件生成匯編代碼文件
-lm:表示標(biāo)準(zhǔn)庫的目錄中名為libm.a的函數(shù)庫
-lpthread :連接NPTL實現(xiàn)的線程庫
-std= :用于指定把使用的C語言的版本
# 例如:
# 把源文件test.c按照c99標(biāo)準(zhǔn)編譯成可執(zhí)行程序test
gcc -o test test.c -lm -std=c99
#把源文件test.c轉(zhuǎn)換為相應(yīng)的匯編程序源文件test.s
gcc -S test.c
20、time命令
該命令用于測算一個命令(即程序)的執(zhí)行時間。它的使用非常簡單,就像平時輸入命令一樣,不過在命令的前面加入一個time即可,例如:
time ./process
time ps aux
在程序或命令運行結(jié)束后,在最后輸出了三個時間,它們分別是:
user:用戶CPU時間,命令執(zhí)行完成花費的用戶CPU時間,即命令在用戶態(tài)中執(zhí)行時間總和;
system:系統(tǒng)CPU時間,命令執(zhí)行完成花費的系統(tǒng)CPU時間,即命令在核心態(tài)中執(zhí)行時間總和;
real:實際時間,從command命令行開始執(zhí)行到運行終止的消逝時間;