Nehalem-EX:極致的性能表現(xiàn)
為了測(cè)試Nehalem-EX的性能,我們采用了一些實(shí)際的并發(fā)應(yīng)用,測(cè)試平臺(tái)采用了配置兩顆至強(qiáng)X7560的戴爾R810,以及運(yùn)行四顆至強(qiáng)X7350的惠普DL580 G3。在察看測(cè)試結(jié)果之前我們先來看看這兩個(gè)系統(tǒng)的差異:惠普DL580 G3配置了4顆四核X7350,主頻2.93GHz,具有4MB三級(jí)緩存;戴爾R810只配置了兩顆8核心X7560,主頻2.26GHz,具有12MB三級(jí)緩存;X7560支持超線程技術(shù),而X7350不支持。雖然兩個(gè)測(cè)試平臺(tái)并不對(duì)等,但如果你采用的還是幾年前的至強(qiáng)7300平臺(tái),可以從下面的數(shù)據(jù)中看到升級(jí)到至強(qiáng)7500平臺(tái)的性能提升。
我們測(cè)試的是很多常見的應(yīng)用:LAME測(cè)試,將一個(gè)152MB的WAV文件轉(zhuǎn)換為256Kbps比特率的MP3文件;壓縮測(cè)試,采用gzip和bzip2來壓縮和解壓一個(gè)55MB的MP3文件;MD5測(cè)試,計(jì)算MD5總和到152MB的文件;MP4-to-FLV測(cè)試,將一個(gè)24MB的MP4文件轉(zhuǎn)化為FLV。這些測(cè)試都是單線程的,通過不斷增加的并發(fā)線程可以測(cè)試物理和邏輯核心、內(nèi)存帶寬、內(nèi)存互聯(lián)以及磁盤I/O。
在測(cè)試Nehalem-EX的時(shí)候,我們分別在超線程開啟/關(guān)閉的情況分別進(jìn)行這些測(cè)試,操作系統(tǒng)是CentOS 5.4,為了消除磁盤I/O瓶頸,我們采用Ramdisk來虛擬硬盤。
在測(cè)試中,兩個(gè)平臺(tái)在一開始的時(shí)候差異并不明顯,在8個(gè)并發(fā)線程的時(shí)候,LAME和gzip測(cè)試中四顆X7350可以和兩顆Nehalem-EX相匹敵,并沒有明顯差異,但在其他測(cè)試中落后比較明顯。在16個(gè)并發(fā)線程的時(shí)候,在所有的測(cè)試中兩個(gè)平臺(tái)拉開了差距,在LAME和gzip測(cè)試中四顆X7350稍微的領(lǐng)先了Nehalem-EX,但是在其他測(cè)試中差距明顯。當(dāng)并發(fā)線程的數(shù)量超過了兩個(gè)平臺(tái)邏輯CPU的數(shù)量,Nehalem-EX在所有測(cè)試中一路領(lǐng)先。
事實(shí)上,由于差距巨大,我們?cè)?8、64和96個(gè)并發(fā)線程的時(shí)候進(jìn)行了很多次測(cè)試來驗(yàn)證結(jié)果。例如,在64個(gè)并發(fā)線程的時(shí)候,Nehalem-EX平臺(tái)花費(fèi)了2分鐘12秒完成MP4-to-FLV的測(cè)試,而X7350平臺(tái)要多花費(fèi)30分鐘,這是一個(gè)巨大的性能差異,隨著線程數(shù)量的增加兩個(gè)平臺(tái)之間的性能差異更加明顯。
這種令人咋舌的性能提升有著多方面的原因,老的X7350平臺(tái)多出了兩顆CPU,并且具有670MHz的主頻優(yōu)勢(shì),但是L3緩存只有4MB,而Nehalem-EX具有24MB。另外,X7350平臺(tái)缺乏QuickPath架構(gòu)的優(yōu)勢(shì),內(nèi)存總線成為瓶頸。因而,在較重的負(fù)載測(cè)試中,Nehalem-EX“秒殺”掉了X7360,盡管物理核心數(shù)量相同并且頻率較低。在比較輕的負(fù)載測(cè)試中,差距并沒有這么明顯。

LAME MP3音頻轉(zhuǎn)換測(cè)試,8到96并發(fā)線程(單位秒,時(shí)間越短越好)
注意這個(gè)圖表,LAME測(cè)試是將一個(gè)152MB的WAV文件轉(zhuǎn)化為256Kbps的MP3文件,MP4-to-FLV測(cè)試是將24MB的MP4文件轉(zhuǎn)化為FLV,硬盤采用ramdisk虛擬。X7350平臺(tái)配置了4顆CPU,主頻2.93GHz,4MB L3緩存。X7560平臺(tái)配置了兩顆8核CPU,主頻2.26GHz,12MB L3緩存,6.4GT/s的QPI總線,1066MHz DDR3內(nèi)存。AMD 8435 “Istanbul”平臺(tái)配置了4顆6核心CPU,主頻2.6GHz,9MB L3緩存,4.8GT/s HyperTransport總線,800MHz DDR2內(nèi)存。另外一個(gè)AMD平臺(tái)配置了4顆四核心CPU。

MP4到FLV轉(zhuǎn)換測(cè)試,8到96并發(fā)線程(單位秒,時(shí)間越短越好)
更多并發(fā)線程下,Nehalem-EX優(yōu)勢(shì)更加明顯
我們?cè)谒腃PU的AMD皓龍8435服務(wù)器上運(yùn)行了同樣的測(cè)試,6核心、2.6GHz的“Istanbul”處理器已經(jīng)發(fā)布了一年多的時(shí)間,和Nehalem-EX已經(jīng)不太匹配,但是也可以做個(gè)參考。
從結(jié)果來看,24核心的AMD伊斯坦布爾系統(tǒng)在一些測(cè)試中可以接近開啟超線程的X7560平臺(tái),盡管如此,16核心的AMD平臺(tái)和沒有開啟超線程的X7560平臺(tái)相比要差距明顯,大概要落后10%。兩個(gè)AMD平臺(tái)都要落后于X7560平臺(tái),特別是在高并發(fā)線程的時(shí)候。畢竟AMD伊斯坦布爾不是最新的平臺(tái),AMD最近發(fā)布了12核心皓龍6100處理器,我們希望它可以和Nehalem-EX一爭(zhēng)高下。

LAME MP3音頻轉(zhuǎn)換測(cè)試,64到192并發(fā)線程(單位為秒,時(shí)間越少越好)
注意這個(gè)圖表,LAME測(cè)試是將一個(gè)152MB的WAV文件轉(zhuǎn)化為256Kbps的MP3文件,MP4-to-FLV測(cè)試是將24MB的MP4文件轉(zhuǎn)化為FLV文件。測(cè)試采用ramdisk虛擬硬盤。X7560平臺(tái)配置了2顆2.26GHz的8核CPU,12MB L3緩存、6.4GT/s QPI總線、1066MHz DDR3內(nèi)存。AMD 8435伊斯坦布爾平臺(tái)配置了4顆主頻2.6GHz的6核CPU,9MB L3緩存,4.8GT/s HT總線。另外一個(gè)AMD平臺(tái)配置了4顆3核伊斯坦布爾CPU。

MP4轉(zhuǎn)化為FLV測(cè)試,64到192并發(fā)線程(單位為秒,時(shí)間越少越好)
本新聞共
3頁(yè),當(dāng)前在第
2頁(yè)
1 2 3