服務器橫評:國貨VS洋貨 為何完勝?!
時間進入到了2010年的下半年,距離至強5600系列的發布已經經歷了半年多的時間。在這段時間里,各個服務器廠商的產品都已經從原有的至強5500升級到了5600,由于接口標準及主板芯片組等多個平臺因素并未進行更新,本次升級過程進行得非常順利,原有的Nehalem產品已經無縫升級到了新一代。最近,我們收到了一臺曙光公司送測的I620r-G服務器,該服務器搭載的處理器型號為至強X5650,也是處理器升級之后的新產品。下面,就讓我們一起來看一看該產品的構造及升級之后的性能如何。
使用了Xeon X5650處理器的曙光I620r-G服務器送測樣機
從前方面板部局中可以看到,曙光I620r-G服務器最多可以支持12個3.5英寸熱插拔硬盤
曙光I620r-G服務器面板細節,這里提供了簡單的服務器狀態指示燈
曙光I620r-G服務器面板細節
從圖中可以看到,這次送測的曙光I620r-G服務器樣機采用了雙電源配置,提供了冗余
#p#
剛才,我們看過了曙光I620r-G服務器的外部結構,值得一提的就是這臺服務器并沒有配備光驅位,12個SATA硬盤位提供了更大的存儲能力。接下來我們就進入服務器的內部,看看它的內部構造如何。
在主要部件位置使用了透明的塑料導風罩,這種設計可以使其形成風洞以加強散熱性能
曙光I620r-G服務器所配置的AVC風扇
想要接觸到CPU等部件需要先將導風罩卸下
送測的曙光I620r-G服務器使用了雙CPU、12條內存以及2塊陣列卡
做工精良的三熱管散熱器
#p#
CPU插槽開啟狀態
Intel Xeon X5650 處理器
至強X5650處理器是至強5600系列的高端型號。我們知道,按照Intel英特爾對于至強處理器的定義,X系列是高端應用版本,E系列是普通版本,而L系列是節能版本。本次,服務器搭配的至強X5650處理器主頻為2.67GHz,也算是比較高的頻率了。和許多Nehalem-EX處理器一樣,至強X5650的L3達到了12MB,內部整合了內存控制器,支持SMT(超線程)技術。它的QPI為3200MHz,是一顆6核心12線程的產品。
來自LSI的陣列卡,其型號為MegaRAID SAS 8708ELP
陣列卡內存顆粒
LSI MegaRAID SAS 8708ELP陣列卡想必大家也是非常的熟悉,之前我們測試過的多款產品都在使用這塊陣列卡。它可以提供對于8塊硬盤的支持,同時支持RAID 5和RAID 6等常用RAID陣列。這次,曙光使用兩塊陣列卡支持12塊硬盤,在測試中我們組建的是常用的RAID 5陣列,兼顧了性能和可靠性。
#p#
服務器使用了12條SAMSUNG 4GB 內存,內存總容量達到了48GB
此次送測的曙光I620r-G服務器使用了Seagate硬盤
Seagate ST31000340NS硬盤單塊容量1TB,其擁有7200轉的轉速與32M緩存
雖然在剛才的介紹中,我們看到了MegaRAID SAS 8708ELP陣列卡的身影,但是曙光為這臺服務器配置的卻是SATA硬盤,而且是企業版的SATA。對于這種面向存儲應用的服務器來說,磁盤性能是我們需要考察的重要內容,而使用企業級SATA硬盤+陣列卡的配置,不但可以保證存儲的可靠性,還可以盡可能大的增加存儲空間,畢竟目前SAS硬盤的最大容量落后SATA硬盤一大截。
配置了2個3Y POWER服務器模塊化電源
單個電源的最大總功率為720W
#p#
看過了服務器的基本配件,最后我們來了解一下服務器主板及配套芯片的信息。
主板共提供了4條PCI Express 2.0 x8插槽
Intel JL82576EB 千兆網卡芯片
整合了顯示芯片的多功能控制芯片
用于遠程網絡管理的Realtek RTL8201N百兆網絡芯片
從至強5500升級到5600,除了處理器變更之外,主板芯片組并未進行更多的更新,我們看到的這臺曙光I620r-G服務器依然使用的是Intel 5520芯片組,也就是我們常說的Tylersburg-36D,這也是成熟的雙路Nehalem-EP平臺,提供了三通道模式。可別以為處理器內部整合了內存控制器就萬事大吉了,我們就見過Nehalem-EP處理器搭配雙通道平臺的事情,很明顯對性能沒有提供完全的支持。
#p#
本次評測的曙光I620r-G服務器配置的是雙路Westmere-EP Xeon X5650處理器,測試結果并會與我們IT168評測中心的DELL PowerEdge 2900 III服務器進行對比,測試對比平臺的詳細參數如下:
測試平臺、測試環境
|
|||||
測試分組
|
|||||
類別
|
Dawning I620r-G服務器 雙路Intel Westmere-EP Xeon X5650 |
DELL PE2900 III服務器 雙路Intel Harpertown Xeon E5430 |
|||
處理器子系統
|
|||||
處理器
|
雙路Intel Xeon X5650
|
雙路Intel Xeon E5430
|
|||
處理器架構
|
Intel 32nm Westmere | Intel 45nm Penryn | |||
處理器代號
|
Gulftown | Harpertown | |||
處理器封裝
|
Socket 1366 LGA | Socke 771 LGA | |||
處理器規格
|
六核 | 四核 | |||
處理器指令集
|
MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT |
MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT |
|||
主頻 | 2.67GHz | 2.66GHz | |||
處理器外部總線 | 2xQPI 2673MHz 6.4GT/s 單向11.73GB/s(每QPI) 雙向23.46GB/s(每QPI) |
FSB 333MHz 1333MT/s 10.6GB/s |
|||
L1 D-Cache
|
6x 32KB 8路集合關聯 |
4x 32KB 8路集合關聯 |
|||
L1 I-Cache
|
6x 32KB 4路集合關聯 |
4x 32KB 8路集合關聯 |
|||
L2 Cache
|
6x 256KB 8路集合關聯 |
2x 6144KB 16路集合關聯 |
|||
L3 Cache
|
12MB 16路集合關聯 |
||||
主板
|
|||||
主板型號
|
Dawning Tylersburg-36D
|
DELL PE2900 III
|
|||
芯片組
|
Intel Tylersburg-EP IOH:Intel 5520(Tylersburg-36D) ICH:Intel 82801JR(ICH10R) |
MCH:Intel 5000X ICH:Intel ESB6321 |
|||
芯片特性 | 2xQPI VT-d |
2xFSB1333 12MB Snoop Filter VT-d |
|||
內存控制器
|
每CPU集成三通道R-ECC DDR3 1333 | 北橋集成四通道FBD DDR2 667 | |||
內存
|
4GB R-ECC DDR3 1333 SDRAM x12 | 2GB FBD DDR2 667 SDRAM x4 | |||
系統磁盤子系統
|
|||||
磁盤控制器
|
LSI Embedded MegaRAID SAS RAID Controller
|
DELL Perc 5/i RAID Controller
|
|||
磁盤控制器規格
|
8xSAS 3Gbps | 8xSAS 3Gbps | |||
磁盤控制器設置
|
RAID 5
|
-
|
|||
磁盤控制器驅動
|
LSI MegaSR 13.06.0212.2009 |
LSI SAS 3.8.0.64 |
|||
磁盤 |
Seagate
Barracuda ES.2 ST31000340NS x3 |
Seagate
Cheetah 15K.5 ST314655SS |
|||
磁盤規格
|
7200RPM 1000GB SATAS 3Gbps 32MB Cache |
15000RPM 146GB SAS 3Gbps 16MB Cache |
|||
磁盤設置
|
SATA 3Gbps 100GB系統分區 |
SAS 3Gbps 20GB系統分區 |
|||
網絡子系統
|
|||||
網卡
|
Intel 82576 Gigabit Dual Port Network Controller | Broadcom BCM5708C PCI-E千兆網卡 x2 |
|||
網卡設置
|
PCI Express x4 I/OAT Intel Teaming Load Balancing |
PCI Express x1 Broadcom NIC Teaming Load Balancing |
|||
網卡驅動
|
Intel PRO Set 10.3.49.00 |
Broadcom NetXtreme 2 11.04.01 |
|||
軟件環境
|
|||||
操作系統 | Microsoft Windows Server 2008 R2 Enterprise Edition x64 |
Microsoft
Windows Server 2008 Enterprise Edition SP1 x64 |
#p#
▲Westmere-EP Xeon X5650處理器,主頻2.67GHz。QPI總線頻率3200MHz
Westmere-EP緩存方面相比Nehalem-EP來說有50%提升
Intel Tylersburg芯片組,采用Intel 5520 + ICH10R芯片組
48GB R-ECC DDR3 1333內存,三通道設置
每條內存4GB,總共12條Micron PC3-10700內存
#p#
下面是Everest軟件對主板芯片組信息的掃描。
至強X5650處理器信息,這里可以看到24個核心,其中12個為超線程
處理器QPI相關信息
內存相關信息,大內存就是好,感慨一下
Tylersburg-36D芯片組信息
南橋信息,依然是我們熟悉的ICH10R
#p#
SPEC CPU 2006整數運算主要包含編譯、壓縮、人工智能、視頻壓縮轉換、XML處理等,此外,各種日常操作也主要是基于整數操作。SPEC CPU 2006的整數運算包含了400.perlbench PERL編程語言、401.bzip2 壓縮、403.gcc C編譯器、429.mcf 組合優化、445.gobmk 人工智能:圍棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:國際象棋、462.libquantum 物理:量子計算、464.h264ref 視頻壓縮、471.omnetpp 離散事件仿真、473.astar 尋路算法、483.xalancbmk XML處理共12項。
從主頻上來看,至強X5650和至強E5430基本接近,兩者0.01GHz的頻率差距不會造成如此強烈的差距。而對于SPEC CPU 2006這款軟件來說,最依賴的還是處理器性能,所以我們可以看出32nm的Westmere-EP核心性能非常強大,多數項目中都領先E5430一倍以上,最大的幅度差距甚至達到了近16倍,這是一個非常恐怖的數字。由此說明,至強X5650性能很強悍,這不僅僅體現在核心數量和緩存容量上,更是由于核心架構的先進決定的。
#p#
SPEC CPU 2006的浮點運算測試包括的全部都是科學運算,科學運算需要用到大量的高精度浮點數據,如410.bwaves 流體力學、416.gamess 量子化學、433.milc 量子力學、434.zeusmp 物理:計算流體力學、435.gromacs 生物化學/分子力學、436.cactusADM 物理:廣義相對論、437.leslie3d 流體力學、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 線形編程、優化、453.povray 影像光線追蹤、454.calculix 結構力學、459.GemsFDTD 計算電磁學、465.tonto 量子化學、470.lbm 流體力學、481.wrf 天氣預報、482.sphinx3 語音識別共17項測試。
浮點測試的成績依然是一邊倒,至強X5650以絕對的優勢領先。雖然差距幅度不如整數運算那么大,也足可以說明新款的Westmere-EP性能之強悍。
#p#
SiSoftware Sandra是一款可運行在32bit和64bit Windows操作系統上的分析軟件,它可以對于系統進行方便、快捷的基準測試,還可以用于查看系統的軟件、硬件等信息。SiSoftware Sandra所有的基準測試都針對SMP和SMT進行了優化,最高可支持32/64路平臺。我們利用了其中多個性能測試模塊對于被測系統的性能進行了快速的測試。
SiSoftware Sandra Pro Business 2010
|
|||
測試對象
|
Dawning I620r-G Westmere-EP服務器 雙路Intel Gulftown Xeon X5650 2.67GHz |
DELL PE2900 III 雙路Intel Harptown Xeon E5430 2.66GHz |
|
Processor Arithmetic Benchmark
處理器架構測試 |
|||
Dhrystone ALU |
246530MIPS
|
91006MIPS | |
Dhrystone ALU vs SPEED | 88.27MIPS/MHz | 34.21MIPS/MHz | |
Whetstone iSSE3
|
177840MFLOPS
|
78385MFLOPS | |
Dhrystone iSSE3 vs SPEED | 63.67MFLOPS/MHz | 29.47MFLOPS/MHz | |
Processor Multi-Media Benchmark
處理器多媒體測試 |
|||
Multi-Media Int x16 iSSE4.1
|
461.57MPixel/s
|
||
Multi-Media Int x8 iSSE4.1 | 199.33MPixel/s | ||
Multi-Media Int x16 iSSE4.1 vs SPEED
|
165.26kkPixels/s/MHz | ||
Multi-Media Int x8 iSSE4.1 vs SPEED | 74.94kPixels/s/MHz | ||
Multi-Media Float x8 iSSE2
|
348.85MPixel/s
|
||
Multi-Media Float x4 iSSE2
|
|
108.69MPixel/s | |
Multi-Media Float x8 iSSE2 vs SPEED
|
124.90kPixels/s/MHz | ||
Multi-Media Float x4 iSSE2 vs SPEED
|
40.86kPixels/s/MHz | ||
Multi-Media Double x4 iSSE2
|
188MPixel/s
|
||
Multi-Media Double x2 iSSE2
|
|
55.75MPixel/s | |
Multi-Media Double x4 iSSE2 vs SPEED
|
67.29kPixels/s/MHz | ||
Multi-Media Double x2 iSSE2 vs SPEED
|
20.96kPixels/s/MHz | ||
Multi-Core Efficiency Benchmark
|
|||
Inter-Core Bandwidth
|
84.43GB/s
|
20.54GB/s | |
Inter-Core Bandwidth vs SPEED
|
30.95MB/s/MHz | 7.91MB/s/MHz | |
Inter-Core Latency(越小越好)
|
20ns
|
90ns | |
Inter-Core Latency vs SPEED
(越小越好) |
0.01ns/MHz | 0.03ns/MHz | |
.NET Arithmetic Benchmark
.NET架構測試 |
|||
Dhrystone .NET
|
46250MIPS
|
10562MIPS | |
Dhrystone .NET vs SPEED
|
28.93MIPS/MHz | 3.97MIPS/MHz | |
Whetstone .NET
|
115370MFLOPS
|
45399MFLOPS | |
Whetstone .NET vs SPEED
|
41.31MFLOPS/MHz | 17.07MFLOPS/MHz | |
.NET Multi-Media Benchmark
.NET多媒體測試 |
|||
Multi-Media Int x1 .NET
|
87.13MPixel/s
|
31.28MPixel/s | |
Multi-Media Int x1 .NET vs SPEED
|
31.19kPixels/s/MHz | 11.76kPixels/s/MHz | |
Multi-Media Float x1 .NET
|
36.56MPixel/s
|
8.68MPixel/s | |
Multi-Media Float x1 .NET vs SPEED
|
13.09kPixels/s/MHz | 3.26kPixels/s/MHz | |
Multi-Media Double x1 .NET
|
66.35MPixel/s
|
24.75MPixel/s | |
Multi-Media Double x1 .NET vs SPEED
|
23.76kPixels/s/MHz | 9.30kPixels/s/MHz |
和之前看到的結果類似,兩款平臺的性能差距依然是在幾何倍數。看來如果您使用的還是老款的至強5400甚至更老的平臺,升級已經是勢在必行了。
#p#
SiSoftware Sandra緩存內存測試主要包括內存帶寬、內存延遲等性能的測試。
SiSoftware Sandra Pro Business 2010
|
|||
測試對象
|
Dawning I620r-G Westmere-EP服務器 雙路Intel Gulftown Xeon X5650 2.67GHz |
DELL PE2900 III 雙路Intel Harptown Xeon E5430 2.66GHz |
|
Memory Bandwidth Benchmark
內存帶寬測試 |
|||
Int Buff'd iSSE2 Memory Bandwidth
|
35.6GB/s | 6.13GB/s | |
Int Buff'd iSSE2 Memory Bandwidth vs SPEED
|
27.41MB/s/MHz | 9.43MB/s/MHz | |
Float Buff'd iSSE2 Memory Bandwidth
|
35.55GB/s | 6.13GB/s | |
Float Buff'd iSSE2 Memory Bandwidth vs SPEED
|
27.37MB/s/MHz | 9.43MB/s/MHz | |
Memory Latency Benchmark
內存延遲測試 |
|||
Memory(Random Access) Latency
(越小越好) |
86ns | 108ns | |
Memory(Random Access) Latency vs SPEED
(越小越好) |
0.06ns/MHz | 0.16ns/MHz | |
Speed Factor(越小越好)
|
60.20 | 95.20 | |
Internal Data Cache
|
4clocks
|
3clocks | |
L2 On-board Cache
|
9clocks
|
18clocks | |
L3 On-board Cache
|
51clocks
|
||
Cache and Memory Benchmark
緩存及內存測試 |
|||
Cache/Memory Bandwidth
|
167GB/s
|
68.88GB/s | |
Cache/Memory Bandwidth vs SPEED
|
61.20MB/s/MHz | 26.52MB/s/MHz | |
Speed Factor(越小越好)
|
27.20 | 111.90 | |
Internal Data Cache | 560.14GB/s | 421.23GB/s | |
L2 On-board Cache | 462.3GB/s | 122.68GB/s |
從結果來看,兩款平臺最大的差距在于內存帶寬測試,這是因為從Nehalem-EP處理器開始,Intel英特爾就已經在處理器中內置了內存控制器。這樣一來,無論是提供的貸款還是讀取速度,從處理器內部運算都要比通過北橋傳輸的至強5400平臺快很多。在內存延遲上,兩款平臺并沒有表現出太明顯的差距,緩存及內存測試中的差距幅度也僅有幾倍,說明這兩項測試,特別是前一項還是比較看重內存本身的特點。
#p#
CineBench是基于Cinem4D工業三維設計軟件引擎的測試軟件,用來測試對象在進行三維設計時的性能,它可以同時測試處理器子系統、內存子系統以及顯示子系統,我們的平臺偏向于服務器多一些,因此就只有前兩個的成績具有意義。和大多數工業設計軟件一樣,CineBench可以完善地支持多核/多處理器,它的顯示子系統測試基于OpenGL。
CineBench R10
|
|||
處理器
|
Dawning I620r-G Westmere-EP服務器 雙路Intel Gulftown Xeon X5650 |
DELL PE 2900 III 雙路Intel Harpertown Xeon E5430 |
|
顯卡 | 集成 | 集成 | |
CPU Benchmark
|
|||
Rendering (1 CPU) | 4437 CB-CPU | 2931 CB-CPU | |
Rendering (x CPU) |
32151 CB-CPU
|
16806 CB-CPU
|
|
Multiprocessor Speedup
|
7.25x
|
5.73x
|
|
OpenGL Benchmark
|
|||
OpenGL Standard
|
202 CB-GFX
|
176 CB-GFX |
CineBench軟件主要考察的是單處理器和多處理器運算的能力。從結果來看,單處理器下至強X5650平臺的性能提升了50%左右,而多處理器下(主要是多核心)的性能提升達到了100%,MS值也達到了7.25,這個成績也得益于至強X5650處理器6核心12線程的貢獻。
#p#
我們的測試服務器采用了三塊Seagate Barracuda ES.2 ST31000340NS硬盤組建了RAID 5陣列,使用的是MegaRAID SAS 8708ELP陣列卡。我們介紹過,ES系列的希捷硬盤雖然也是SATA接口,但是卻是針對企業級應用的,能夠提供7*24小時的不間斷運行。而基準平臺并沒有準備陣列,只是普通的單磁盤服務器。
IO讀
IO寫
讀吞吐量
寫吞吐量
借助于MegaRAID SAS 8708ELP陣列卡的優勢,即便是7200rpm的SATA硬盤也達到了比較高的速度,讀取IOps達到了80000以上,寫入IOps接近100000。吞吐量方面,被測服務器的讀取速度達到了500MBps以上,寫入速度接近450MBps,這個成績即便是對于15000rpm的硬盤來說也很難得了。可以說,這些都是陣列卡的功勞。
相比之下,我們的基準服務器就遜色得太多了,沒辦法,單磁盤服務器也就是這個水平。
#p#
我們在被測服務器上安裝了Microsoft SQL 2005 SP1,按照測試要求建立了數據庫。BF在測試之前會在數據庫中生成9個表,其中包括4個500萬行的表格,每行包括100字節的數據,因此每個表格容量大約是476MB,整個數據庫容量為1.86GB。我們用60個客戶端模擬1000個用戶,在這個數據庫中進行查詢、添加、刪除、修改等操作。
又是一個差距明顯的項目。我們可以看到,被測服務器的TPS非常高,峰值TPS超過了180000,也只有Westmere-EP能夠有這樣高的水平。相比之下,基準服務器的成績只有50000多一些,差距在3倍以上。
#p#
至強5600自發布以來,已經成為了行業的熱點,掀起了繼Nehalem-EP之后的又一輪處理器性能提升。從我們本次的測試來看,曙光送測的I620r-G服務器借助于新處理器的支持,已經全面超過了老一代的至強5400系列,而且性能提升幅度驚人。
使用了Xeon X5650處理器的曙光I620r-G服務器送測樣機
正如我們在文章最初提到的,從Nehalem-EP過渡到Westmere-EP,Intel英特爾已經實現了處理器的無縫升級。而且包括主板及其他配件在內,也無需更換任何的設備,可以直接支持最新的處理器,這對于經常變換處理器接口的Intel英特爾來說已經是難能可貴,畢竟服務器這樣的企業級設備并不是需要經常更新的。
抱著探索的目的,我們對于這臺曙光I620r-G服務器進行了全面的測試,測試結果既在我們的預料之內,又超乎了我們的想象。作為新一代的平臺,搭配至強X5650的曙光I620r-G服務器理所應當超過原有的老款產品,這點是毫無疑問的;但是讓我們沒想到的是兩代產品的差距居然如此明顯,達到了最大近16倍差距的地步,而一般的測試項目也有至少3倍以上的性能提升。
應該說,本次評測的曙光I620r-G服務器是一款性能強勁的產品。如果您的公司還在使用老款的至強5400甚至更老規格的服務器,我們覺得您應該嘗試一下新一代32nm Westmere-EP所帶來的提升,絕對可以讓你的工作事半功倍。
【編輯推薦】