如何提高多線程程序的
如何提高多線程程序的
正如大家所知道的那樣,多核多cpu越來越普遍了,而且編寫多線程程序也是件很簡單的事情。那么,如何提高多線程的CPU的一些使用率,下面是學(xué)習(xí)啦小編帶來的關(guān)于如何提高多線程程序的cpu利用率的內(nèi)容,歡迎閱讀!
如何提高多線程程序的:
首先,我來講一下多處理的一些知識。如下圖所示,
多處理器系統(tǒng)也只有一個待運行的線程隊列,內(nèi)存中也只有一個操作系統(tǒng)拷貝,而且也只有一個內(nèi)存系統(tǒng),但是會有多個cpu同時運行不同的線程。一個cpu運行一個線程,那么上圖中的系統(tǒng)最多能在同一時間運行2個線程。其實,多處理系統(tǒng)需要掌握的知識不是這些,而是緩存一致性。
現(xiàn)在來解釋下什么是緩存一致性。由于,還是只有一個內(nèi)存系統(tǒng)。所有cpu都要和這個內(nèi)存系統(tǒng)通信,但是只有一條總線,那么這無疑會造成總線緊張,限制整體的速度了。那么,你多個cpu也沒多少意義了。解決這個問題的辦法還是利用cpu的緩存機制,學(xué)過組成原理的同學(xué)都知道,cpu的緩存命中率還是很高的,有90%以上吧。那么,我繼續(xù)利用緩存機制還是可以降低總線的頻繁使用的。但是,每個cpu都有自己的緩存。如果有2個cpu的緩存存儲的是同一內(nèi)存數(shù)據(jù)的內(nèi)容,其中一個cpu的緩存更新了,另外一個cpu的緩存也必須更新,這就是所謂的緩存一致性。編程多線程程序的一個很重要的一點就是避免因為緩存一致性引起的緩存更新風暴。
現(xiàn)在我舉一個緩存更新風暴的例子。
如圖所示的類定義,
鎖lockHttp和lockSsl中間只有8個字節(jié),而絕大部分系統(tǒng)上一個緩存行是128個字節(jié),那么這2個鎖很可能就處在同一個緩存行上面。那么,最壞的情況會發(fā)生什么事情了。假設(shè)處理器P1在運行一個處理http請求的線程T1,處理器P2在運行一個處理ssl請求的線程T2,那么當T1獲得鎖lockHttp的時候,鎖的內(nèi)容就會改變,為了保持緩存一致性,就會更新P2的緩存。那么,T2要獲得鎖lockssl的時候,發(fā)現(xiàn)緩存已經(jīng)失效了,就必須從內(nèi)存中重新加載緩存之類??傊@會將緩存命中率降低到90%以下,引起性能的嚴重降低。而且發(fā)生這種事情的原因是因為我們不了解硬件的體系結(jié)構(gòu)。
多cpu不能成倍提高速度的原因是任務(wù)的某些部分是必須串行處理的。比如,矩陣乘法可以分為三個部分,初始化矩陣,相乘,返回結(jié)果。這三部分第二部分可以用多線程來處理,第一部分和第三部分則是不可以的。而且第二部分必須在第一部分完成之后,第三部分必須在第一部分完成之后。那么,無論你添加多少個處理器,最快的時間都至少是第一部分和第二部分的時間之和。這個事實好像叫做Amdahl法則。
如果使用多線程,那么就必須考慮線程同步,而線程同步又是導(dǎo)致速度降低的關(guān)鍵。所以下面就講述一些方法來加快多線程程序的吞吐速度。
方法一,把一個任務(wù)分解為多個可以子任務(wù)。
因為總有些子任務(wù)是可以并發(fā)的,多個子任務(wù)并發(fā)執(zhí)行了很可能就能夠避免cpu需要io操作的完成了,而且能夠提高系統(tǒng)的吞吐量。
方法二,緩存多線程的共享數(shù)據(jù)。
當你已經(jīng)在使用多線程了,很多時候必須使用共享數(shù)據(jù)。如果,數(shù)據(jù)是只讀的,那么可以在第一次獲取后保存起來,以后就可以重復(fù)使用了。但是,第一次的獲取還是無法避免的需要線程同步操作的。
方法三,如果線程數(shù)目有限,就不要共享數(shù)據(jù)。
做法是為每一個線程實例化一個單獨的數(shù)據(jù),其實就是為每一個線程分配一塊數(shù)據(jù)使用。這樣沒有線程同步操作了,速度可以盡可能的提示。
方法四,如果沒辦法確定線程數(shù)目到底有多少,那么使用部分共享吧。
部分共享其實就是使用多個資源池代替一個資源池,資源池的數(shù)目得更加經(jīng)驗來確定。如下圖所示,
最后在提一個叫做Thundering Herd的問題,該問題維基百科有定義。大意是,當多個線程在等待一個資源的時候,如果事件等待到了,操作系統(tǒng)是喚醒所有等待的線程讓它們自己去競爭資源了還是選擇一個線程把資源給它。當然喚醒所有的線程肯定開銷要大,而且所有沒有搶到資源的線程還得重新進入等待狀態(tài),這無疑造成很多沒必要的操作,浪費了沒必要的線程上下文切換??傊?,會不會存在Thundering Herd還是跟不同的操作系統(tǒng)有關(guān)的。萬一存在Thundering Herd了,多線程可能就沒那么好辦了。
到現(xiàn)在我們知道了為什么多cpu并不能成倍提高程序的速度了。首先因為有些任務(wù)無法并行,其次即使是并行cpu之間還是有很多牽制的。
看了如何提高多線程程序的文章內(nèi)容的人還看: