根據運行的環境,操作系統可以分為桌面操作系統,手機操作系統,服務器操作系統,嵌入式操作系統等。 awk是功能強大的文本分析工具. 與grep搜索和sed編輯相比,awk在分析數據和生成報告時特別強大. 簡而言之,awk逐行讀取文件,將每一行用空格分割為默認分隔符,然后對剪切的部分執行各種分析處理. awk有3種不同的版本: awk,nawk和gawk,沒有特殊說明,通常是指gawk,它是AWK的GNU版本. awk的名字來源于其姓氏的首字母,即創始人Alfred Aho,Peter Weinberger和Brian Kernighan. 實際上,AWK確實有其自己的語言: AWK編程語言,由三位創建者正式定義為“樣式掃描和處理語言”. 它使您可以創建簡短的程序來讀取輸入文件,排序數據,處理數據,對輸入進行計算,生成報告以及無數其他功能. awk '{pattern + action}' {filenames} 盡管操作可能很復雜,但語法始終相同,其中pattern表示AWK在數據中查找的內容,而action是在找到匹配內容時執行的一系列命令. 花括號({})不一定總是出現在程序中,而是用于根據特定的模式對一系列指令進行分組. pattern是要表示的正則表達式,用斜杠括起來. awk語言的最基本功能是根據文件或字符串中的指定規則瀏覽和提取信息. 只有在awk提取信息之后,才能執行其他文本操作. 完整的awk腳本通常用于格式化文本文件中的信息. 通常,awk在文件的一行中處理單位. Awk接收文件的每一行,然后執行相應的命令來處理文本. 有三種方法來調用awk 1.命令行方式 awk [-F field-separator] 'commands' input-file(s) 其中,commands 是真正awk命令,[-F域分隔符]是可選的。 input-file(s) 是待處理的文件。 在awk中,文件的每一行中,由域分隔符分開的每一項稱為一個域。通常,在不指名-F域分隔符的情況下,默認的域分隔符是空格。 2.shell腳本方式 將所有的awk命令插入一個文件,并使awk程序可執行,然后awk命令解釋器作為腳本的首行,一遍通過鍵入腳本名稱來調用。 相當于shell腳本首行的:#!/bin/sh 可以換成:#!/bin/awk 3.將所有的awk命令插入一個單獨文件,然后調用: awk -f awk-script-file input-file(s) 其中,-f選項加載awk-script-file中的awk腳本,input-file(s)跟上面的是一樣的。 本章重點介紹命令行方法. 假設last -n 5的輸出如下 [root@www ~]# last -n 5 <==僅取出前五行 root pts/1 192.168.1.100 Tue Feb 10 11:21 still logged in root pts/1 192.168.1.100 Tue Feb 10 00:46 - 02:28 (01:41) root pts/1 192.168.1.100 Mon Feb 9 11:41 - 18:30 (06:48) dmtsai pts/1 192.168.1.100 Mon Feb 9 11:41 - 11:41 (00:00) root tty1 Fri Sep 5 14:09 - 14:10 (00:01) 如果僅顯示最近登錄的5個帳戶 #last -n 5 | awk '{print $1}' awk的工作流程是這樣的: 讀取由'\ n'換行符分隔的記錄awk數組初始化,然后根據指定的字段分隔符將記錄分為多個字段,填寫字段,$ 0表示所有字段,$ 1表示第一個域,$ n表示第n個域. 默認的域分隔符是“空白鍵”或“ [tab]鍵”,因此$ 1表示登錄用戶,$ 3表示登錄用戶ip,依此類推. 如果僅顯示/ etc / passwd的帳戶 #cat /etc/passwd |awk -F ':' '{print $1}' root daemon bin sys 這是awk + ??action的示例,每行將執行action {print $ 1}. -F將域分隔符指定為': '. 如果僅顯示/ etc / passwd的帳戶和該帳戶對應的外殼,并且該帳戶和外殼之間通過Tab鍵分開 #cat /etc/passwd |awk -F ':' '{print $1"\t"$7}' root /bin/bash daemon /bin/sh bin /bin/sh sys /bin/sh 如果僅顯示/ etc / passwd的帳戶以及與該帳戶對應的外殼,并且該帳戶和外殼用逗號分隔,并且列名和外殼名稱將添加到所有行中,并且“藍色,/ bin / nosh“添加到最后一行”. cat /etc/passwd |awk -F ':' 'BEGIN {print "name,shell"} {print $1","$7} END {print "blue,/bin/nosh"}' name,shell root,/bin/bash daemon,/bin/sh bin,/bin/sh sys,/bin/sh .... blue,/bin/nosh awk的工作流程是這樣的: 首先執行BEGING,然后讀取文件,讀取由/ n換行符分割的記錄,然后根據指定的字段分隔符將記錄分為多個字段,填充該字段,并且$ 0表示all域,$ 1代表第一個域,$ n代表第n個域,然后開始執行與該模式對應的操作. 然后開始讀取第二條記錄...,直到已讀取所有記錄,最后執行END操作. 使用root關鍵字搜索/ etc / passwd中的所有行 #awk -F: '/root/' /etc/passwd root:x:0:0:root:/root:/bin/bash 這是使用模式的示例. 僅匹配模式(在此為root)的行將執行該操作(未指定該操作,并且默認情況下將輸出每行的內容). 搜索常規支持,例如,找到root: awk -F: '/ ^ root /'/ etc / passwd 使用root關鍵字搜索/ etc / passwd中的所有行并顯示相應的shell # awk -F: '/root/{print $7}' /etc/passwd /bin/bash 在這里指定了 action {print $ 7} Awk具有許多用于設置環境信息的內置變量. 這些變量可以更改. 這是一些最常用的變量. ARGC 命令行參數個數 ARGV 命令行參數排列 ENVIRON 支持隊列中系統環境變量的使用 FILENAME awk瀏覽的文件名 FNR 瀏覽文件的記錄數 FS 設置輸入域分隔符,等價于命令行 -F選項 NF 瀏覽記錄的域的個數 NR 已讀的記錄數 OFS 輸出域分隔符 ORS 輸出記錄分隔符 RS 控制記錄分隔符 此外,$ 0變量引用整個記錄. $ 1代表當前行的第一個字段,$ 2代表當前行的第二個字段,...依此類推. Statistics / etc / passwd: 文件名,每行的行號,每行的列數以及相應的完整行內容: #awk -F ':' '{print "filename:" FILENAME ",linenumber:" NR ",columns:" NF ",linecontent:"$0}' /etc/passwd filename:/etc/passwd,linenumber:1,columns:7,linecontent:root:x:0:0:root:/root:/bin/bash filename:/etc/passwd,linenumber:2,columns:7,linecontent:daemon:x:1:1:daemon:/usr/sbin:/bin/sh filename:/etc/passwd,linenumber:3,columns:7,linecontent:bin:x:2:2:bin:/bin:/bin/sh filename:/etc/passwd,linenumber:4,columns:7,linecontent:sys:x:3:3:sys:/dev:/bin/sh 使用printf代替print可以使代碼更簡潔易讀 awk -F ':' '{printf("filename:s,linenumber:%s,columns:%s,linecontent:%s\n",FILENAME,NR,NF,$0)}' /etc/passwd Awk同時提供打印和printf功能. 打印功能的參數可以是變量,值或字符串. 字符串必須用雙引號引起來,并且參數用逗號分隔. 如果沒有逗號,則將參數串聯起來并且無法區分. 在這里,逗號的作用與輸出文件的分隔符相同awk數組初始化,只是后者是一個空格. printf函數,其用法基本上類似于C語言中的printf. 它可以格式化字符串. 當輸出復雜時,printf更易于使用,代碼也更易于理解. 變量和賦值 除了awk的內置變量外,awk還可以自定義變量. 以下計算/ etc / passwd中的帳戶數量 awk '{count++;print $0;} END{print "user count is ", count}' /etc/passwd root:x:0:0:root:/root:/bin/bash ...... user count is 40 count是一個自定義變量. 在上一個動作{}中,只有一張印刷品. 實際上,print只是一個語句,而action {}可以有多個語句,并以;. 分隔. 此處未初始化計數. 盡管默認值為0,但將其初始化為0是適當的: awk 'BEGIN {count=0;print "[start]user count is ", count} {count=count+1;print $0;} END{print "[end]user count is ", count}' /etc/passwd [start]user count is 0 root:x:0:0:root:/root:/bin/bash ... [end]user count is 40 計算文件夾中文件占用的字節數 ls -l |awk 'BEGIN {size=0;} {size=size+$5;} END{print "[end]size is ", size}' 如果以M為單位顯示: ls -l |awk 'BEGIN {size=0;} {size=size+$5;} END{print "[end]size is ", size/1024/1024,"M"}' 請注意,統計信息不包括文件夾的子目錄. 有條件的聲明
|
溫馨提示:喜歡本站的話,請收藏一下本站!