單路發揮受限 惠普DL380 G7服務器評測
在今年3月16日(美國時間),Intel發布了Nehalem-EP處理器的繼任者Westmere-EP。新一代的處理器采用了32nm工藝制程,在功耗大致不變的情況下,將處理器的核心數量提升到了6個,并在各個方面都有所改進。
Xeon 5600:Westmere-EP
一般來說,各大服務器廠商隨后都會推出采用新的處理器以及融合其他新技術的一系列產品,只是今年來的似乎晚一些。HP的采用Westmere-EP處理器的新一代雙路服務器產品以G7為后綴,例如,我們收到的一臺ProLiant DL380 G7,是上一年我們測過的DL380 G6的后續型號。
HP ProLiant DL380 G7服務器
DL380 G7外觀上和DL380 G6沒有太大區別,它們的內部有什么差別呢?
HP DL380 G6服務器
#p#
用來拖出服務器的一個設計
這個小塑料條上記載了尋求技術支持必須的信息;它右邊的LED陣列指示了各大主要配件的工作狀況
支持冗余電源
操作需要內六角扳手……機器自帶了一個(注意上上圖和上圖的分別)
#p#
460W的電源,單路12V輸出38.3A
硬盤籠的背板,使用常見的SFF8087插頭
一共六個熱插拔風扇
#p#
散熱器下的是單路Xeon E5620處理器,代號Westmere-EP,32nm工藝,4核心帶超線程,頻率2.40GHz
可以看到,E5620特別的地方是它4個核心也具有12MB的L3緩存;它的TDP是80W
自帶三條R-DDR3 1333內存,不過,E5620處理器只支持到DDR3-1066
使用的15000RPM 146GB硬盤,一共三個,通過一個陣列卡搭建成一個RAID 5陣列
Broadcom BCM5709C雙口千兆網卡,具有普通的TOE卸載引擎以及iSCSIoE卸載引擎和RDMA引擎,并支持RSS、MSI/MSI-X特性
#p#
我們準備了數個用來對比的平臺。在一些DL380 G6沒有進行的新測試項目中,將使用Xeon X5680的數據來代替,X5680的頻率比X5670高一些,其他方面和X5670平臺沒什么區別。
#p#
SiSoftware Sandra是一款可運行在32bit和64bit Windows操作系統上的分析軟件,它可以對于系統進行方便、快捷的基準測試,還可以用于查看系統的軟件、硬件等信息。SiSoftware Sandra所有的基準測試都針對SMP和SMT進行了優化,***可支持32/64路平臺。我們利用了其中多個性能測試模塊對于被測系統的性能進行了快速的測試。
SiSoftware Sandra Pro Business 2010
|
||||
---|---|---|---|---|
測試對象
|
雙路Intel Nehalem-EP Xeon X5570 |
雙路Intel Westmere-EP Xeon X5670 |
HP ProLiant DL380 G6 雙路Intel Nehalem-EP Xeon E5540 |
HP ProLiant DL360 G7 單路Intel Westmere-EP Xeon E5620 |
Processor Arithmetic Benchmark
處理器算術性能測試 |
||||
Aggregate Arithmetic Performance
|
147.17GOPS | 218.69GOPS | 133.63GOPS | 62.33GOPS |
Dhrystone iSSE4.2
|
172.5GIPS | 257GIPS | 156.4GIPS | 72.4GIPS |
Whetstone iSSE3
|
121.84GFLOPS | 180.41GFLOPS | 110.88GFLOPS | 52.26GFLOPS |
Processor Multi-Media Benchmark
處理器多媒體性能測試 |
||||
Aggregate Multi-Media Performance
|
251.49MPixel/s | 118.86MPixel/s | ||
Multi-Media Int x16 iSSE4.1
|
317.13MPixel/s | 470.51MPixel/s | 288MPixel/s | 136.21MPixel/s |
Multi-Media Float x8 iSSE2
|
237MPixel/s | 350.2MPixel/s | 215MPixel/s | 101.5MPixel/s |
Multi-Media Double x4 iSSE2
|
128.62MPixel/s | 190.87MPixel/s | 116.69MPixel/s | 55.24MPixel/s |
Multi-Core Efficiency Benchmark
多核效率測試 |
||||
Inter-Core Bandwidth
|
71.15GB/s | 80.7GB/s | 61GB/s | 31.38GB/s |
Inter-Core Latency
(越小越好) |
18ns | 18ns | 18ns | 20ns |
Cryptography Benchmark
加密解密性能測試 |
||||
Cryptographic Bandwidth
|
4GB/s | |||
AES128-ECB iAES
Cryptographic Bandwidth |
7.43GB/s | |||
SHA256 iSSE4 Hashing Bandwidth
|
661MB/s | |||
.NET Arithmetic Benchmark
.NET算術性能測試 |
||||
Aggregate .NET Performance
|
48.46GIPS | 24.63GIPS | ||
Dhrystone .NET
|
32.11GIPS | 32.2GIPS | 29.13GIPS | 13.85GIPS |
Whetstone .NET
|
79.56GFLOPS | 115GFLOPS | 67.8GFLOPS | 35.4GFLOPS |
.NET Multi-Media Benchmark
.NET多媒體性能測試 |
||||
Aggregate .NET Multi-Media Performance
|
38MPixel/s | 18MPixel/s | ||
Multi-Media Int x1 .NET
|
59MPixel/s | 88.64MPixel/s | 53.4MPixel/s | 25.4MPixel/s |
Multi-Media Float x1 .NET
|
25.22MPixel/s | 37.73MPixel/s | 22.78MPixel/s | 10.68MPixel/s |
Multi-Media Double x1 .NET
|
48.3MPixel/s | 68.45MPixel/s | 43.6MPixel/s | 19.85MPixel/s |
單路配置限制了DL380 G7的發揮。#p#
SiSoftware Sandra緩存內存測試主要包括內存帶寬、內存延遲等性能的測試。
單路配置下,在某幾項延遲指標中表現不錯。
SiSoftware Sandra Pro Business 2010
|
||||
---|---|---|---|---|
測試對象
|
雙路Intel Nehalem-EP Xeon X5570 |
雙路Intel Westmere-EP Xeon X5670 |
HP ProLiant DL380 G6 雙路Intel Nehalem-EP Xeon E5540 |
HP ProLiant DL360 G7 單路Intel Westmere-EP Xeon E5620 |
Memory Bandwidth Benchmark
內存帶寬測試 |
||||
Aggregate Memory Performance
|
24.19GB/s | 19GB/s | ||
Int Buff'd iSSE2 Memory Bandwidth
|
38GB/s | 35GB/s | 24.18GB/s | 19GB/s |
Float Buff'd iSSE2 Memory Bandwidth
|
38GB/s | 35GB/s | 24.2GB/s | 19GB/s |
Memory Latency Benchmark(Random)
內存延遲測試(隨機) |
||||
Memory(Random Access) Latency
(越小越好) |
80ns | 83ns | 114ns | 90ns |
Speed Factor
(越小越好) |
55.50 | 57.00 | 77.10 | 58.00 |
Internal Data Cache
|
4clocks | 4clocks | 4clocks | 4clocks |
L2 On-board Cache
|
11clocks | 10clocks | 9clocks | 9clocks |
L3 On-board Cache
|
49clocks | 57clocks | 47clocks | 51clocks |
Memory Latency Benchmark(Linear)
內存延遲測試(線性) |
||||
Memory(Linear Access) Latency
(越小越好) |
7ns | 7ns | 12ns | 7ns |
Speed Factor
(越小越好) |
4.80 | 5.10 | 7.60 | 4.70 |
Internal Data Cache
|
4clocks | 4clocks | 4clocks | 4clocks |
L2 On-board Cache
|
10clocks | 11clocks | 11clocks | 9clocks |
L3 On-board Cache
|
13clocks | 13clocks | 13clocks | 11clocks |
Cache and Memory Benchmark
緩存及內存測試 |
||||
Cache/Memory Bandwidth
|
142GB/s | 183.26GB/s | 120GB/s | 58.64GB/s |
Speed Factor
(越小越好) |
21.20 | 31.00 | 25.40 | 20.10 |
Internal Data Cache
|
471GB/s | 663.51GB/s | 425.58GB/s | 207.22GB/s |
L2 On-board Cache
|
295.4GB/s | 537.88GB/s | 270.3GB/s | 128.47GB/s |
L3 On-board Cache
|
92.56GB/s | 36GB/s |
#p#
SPEC CPU 2006整數運算主要包含編譯、壓縮、人工智能、視頻壓縮轉換、XML處理等,此外,各種日常操作也主要是基于整數操作。SPEC CPU 2006的整數運算包含了400.perlbench PERL編程語言、401.bzip2 壓縮、403.gcc C編譯器、429.mcf 組合優化、445.gobmk 人工智能:圍棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:國際象棋、462.libquantum 物理:量子計算、464.h264ref 視頻壓縮、471.omnetpp 離散事件仿真、473.astar 尋路算法、483.xalancbmk XML處理共12項。
#p#
SPEC CPU 2006的浮點運算測試包括的全部都是科學運算,科學運算需要用到大量的高精度浮點數據,如410.bwaves 流體力學、416.gamess 量子化學、433.milc 量子力學、434.zeusmp 物理:計算流體力學、435.gromacs 生物化學/分子力學、436.cactusADM 物理:廣義相對論、437.leslie3d 流體力學、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 線形編程、優化、453.povray 影像光線追蹤、454.calculix 結構力學、459.GemsFDTD 計算電磁學、465.tonto 量子化學、470.lbm 流體力學、481.wrf 天氣預報、482.sphinx3 語音識別共17項測試。
#p#
CineBench是基于Cinem4D工業三維設計軟件引擎的測試軟件,用來測試對象在進行三維設計時的性能,它可以同時測試處理器子系統、內存子系統以及顯示子系統,我們的平臺偏向于服務器多一些,因此就只有前兩個的成績具有意義。和大多數工業設計軟件一樣,CineBench可以完善地支持多核/多處理器,它的顯示子系統測試基于OpenGL。
CineBench R11.5 64bit
|
||||
處理器 | 雙路Intel Nehalem-EP Xeon X5570 |
雙路Intel Westmere-EP Xeon X5670 |
雙路Intel Westmere-EP Xeon X5680 |
HP ProLiant DL360 G7 單路Intel Westmere-EP Xeon E5620 |
顯卡 | - | - | - | - |
CPU Benchmark
|
||||
Rendering (1 CPU) | 1.02 pts | 1.02 pts | 1.16 pts | 0.91 pts |
Rendering (x CPU) | 9.92 pts | 14.58 pts | 16.40 pts | 4.31 pts |
Multiprocessor Speedup | 9.68x | 14.33x | 14.18x | 4.73x |
總成績是4.31 pts。#p#
Web服務器測試分為靜態應用測試和動態應用測試,處理器計算能力、緩存內存效能則對于動態應用的性能有明顯影響,而IO能力對于靜態應用的性能有明顯的影響。
Web服務器使用了Windows Server 2008 R2自帶的IIS 7.5。
靜態頁面下的性能已經超過了單個千兆網口的極限,這表明瓶頸是在處理器上。網絡子系統用的是4個BCM5709C千兆網口的端口聚合。
靜態頁面性能
動態頁面性能
#p#
峰值是75749 TPS,比頻率相近的單路Nehalem-EP約6萬多的成績要好不少。#p#
DL380 G7是惠普第七代服務器當中的2U主流規格型號,采用了***的Intel 32nm Westmere-EP處理器,不過遺憾的是我們收到的DL380 G7樣機是單路E5620配置,沒有完全發揮出Westmere-EP的威力。高端的Westmere-EP型號可以提供默認頻率3.33GHz、六個核心十二個線程,提供非常充足的計算能力。用戶可以在購買時選擇處理器、內存等部件的規格配置。
HP ProLiant DL380 G7服務器
由于配置較低,因此測試成績不會讓人具有太深刻的印象,不過,測試中它也提供了不錯的性能,可以滿足小型網站、小型工作組的需求。此外,HP ProLiant DL380 G7的前面板LED指示燈非常有用,幫助我們及時排除了測試中出現過的幾次內存沒插好的現象。DL380 G6的整體工業設計很不錯。
【編輯推薦】