Linux命令查看系統(tǒng)平均負(fù)載的方法
Linux命令查看系統(tǒng)平均負(fù)載的方法
文章主要介紹了通過Linux命令查看系統(tǒng)平均負(fù)載的方法,對(duì)于服務(wù)器管理員來說非常有用接下來是小編為大家收集的Linux命令查看系統(tǒng)平均負(fù)載的方法,歡迎大家閱讀:
Linux命令查看系統(tǒng)平均負(fù)載的方法
1、Linux系統(tǒng)的平均負(fù)載的概念
有時(shí)候我們會(huì)覺得系統(tǒng)響應(yīng)很慢,但是又找不到原因,這時(shí)就要查看平均負(fù)載了,看它是否有大量的進(jìn)程在排隊(duì)等待。特定時(shí)間間隔內(nèi)運(yùn)行隊(duì)列中的平均進(jìn)程數(shù)可以反映系統(tǒng)的繁忙程度,所以我們通常會(huì)在自己的網(wǎng)站或系統(tǒng)變慢時(shí)第一時(shí)間查系統(tǒng)的負(fù)載,即CPU的平均負(fù)載。
2、查看平均負(fù)載
究竟應(yīng)該如何查看平均負(fù)載呢?最簡單的命令是uptime,如下所示:
代碼如下:
[root@localhost ~]# uptime
11:31:11 up 11 days, 19:01, 2 users, load average: 0.02, 0.01, 0.00
目前的主流服務(wù)器都是雙四核,有相當(dāng)強(qiáng)悍的CPU,做一般的應(yīng)用服務(wù)的話,Linux系統(tǒng)的負(fù)載這塊倒不用我們擔(dān)心。
還可以用w命令來查看,順便可以查看一下系統(tǒng)當(dāng)前有哪些用戶,他們占用了哪些終端,如下所示:
代碼如下:
[root@localhost ~]# w
11:33:00 up 11 days, 19:03, 2 users, load average: 0.00, 0.00, 0.00
USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
root pts/1113.57.224.3 09:032:11m 0.04s 0.04s -bash
root pts/2113.57.224.3 11:310.00s 0.02s 0.00s w
另外,還有動(dòng)態(tài)命令top,這個(gè)命令也可以反映系統(tǒng)負(fù)載情況。在下面的命令提示中,我們只關(guān)心加粗字體部分。
代碼如下:
[root@localhost ~]# top
top - 11:37:47 up 11 days, 19:08, 2 users, load average: 0.00, 0.00, 0.00
Tasks: 122 total, 1 running, 121 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.1%us, 0.0%sy, 0.0%ni, 99.9%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 4044136k total, 1435504k used, 2608632k free, 274740k buffers
Swap: 8193140k total,0k used, 8193140k free, 941884k cached
上面加粗字體顯示的內(nèi)容是什么意思呢?再通過uptime查看一下。
代碼如下:
[root@localhost ~]# uptime
11:39:36 up 11 days, 19:16, 1 user, load average: 0.09, 0.03, 0.01
原來它所表示的是過去的1分鐘、5分鐘和15分鐘內(nèi)進(jìn)程隊(duì)列中的平均進(jìn)程數(shù)量。
那么,如何衡量當(dāng)前系統(tǒng)是否負(fù)載過高呢?可以從以下幾點(diǎn)來考慮。
如果每個(gè)CPU(可以按CPU核心的數(shù)量計(jì)算)當(dāng)前的活動(dòng)進(jìn)程數(shù)不大于3,則系統(tǒng)性能良好。
如果每個(gè)CPU當(dāng)前的活動(dòng)進(jìn)程數(shù)不大于4,表示可以接受。
如果每個(gè)CPU當(dāng)前的活動(dòng)進(jìn)程數(shù)大于5,則系統(tǒng)性能問題嚴(yán)重。
還可以結(jié)合vmstat命令來判斷我們的系統(tǒng)是否過于繁忙,如果確定很繁忙的話,就要考慮是否更換服務(wù)器或增加CPU的個(gè)數(shù)了。總結(jié)如下:
如果r經(jīng)常大于3或4,且id經(jīng)常少于50,則表示CPU的負(fù)荷很重。
在上面例子中,我的服務(wù)器是PowerEdge 2850,CPU是雙核雙線程的,則0.09/2=0.045(即負(fù)載值/真實(shí)CPU個(gè)數(shù)),此系統(tǒng)的CPU負(fù)載基本可以忽略了。事實(shí)上,現(xiàn)在主流服務(wù)器 的CPU都很強(qiáng)悍,如果不是應(yīng)用虛擬化等特殊場(chǎng)景,基本上負(fù)載都很小。
按照前面的計(jì)算公式,我所配置Nagios報(bào)警的CPU負(fù)載閾值 為CPU核心的數(shù)量(即CPU的物理個(gè)數(shù)×核數(shù))。還是以我的服務(wù)器PowerEdge 2850為例,其CPU核心的數(shù)量為2×2=4,則設(shè)置報(bào)警值為4。這樣設(shè)置是合理的,因?yàn)楫吘共皇敲總€(gè)應(yīng)用服務(wù)器的CPU都支持多核心,畢竟整個(gè)網(wǎng)站中 還有些性能比較弱的服務(wù)器是用來做備份的。
看了“Linux命令查看系統(tǒng)平均負(fù)載的方法”還想看: