小工具分享:不被數據表面迷惑,洞察真實負載!
“大吉大利,晚上吃雞!” 最近,《絕地求生》游戲風靡網絡, 很多朋友為了能“晚上吃雞”, 不分晝夜,廢寢忘食, 但往往奮戰(zhàn)到天亮也吃不到“雞”。 如果是運氣不佳、水平太low也能理解, 但若是由于電腦太卡,那就著實太讓人惱火了。 ” 申斯基就有這樣一個朋友,癡迷“吃雞”,但從沒享受過“吃雞”的快感。一次恰好去他家里,看到卡頓得像播放幻燈片一樣的游戲畫面,申斯基總算知道了朋友為何一直吃不到“雞”。 朋友也很苦惱,這臺電腦并不算舊,配置肯定超過了《絕地求生》的***要求,但堪稱“腦盲”的他一直不知道問題出在哪里。一番檢查之后,發(fā)現(xiàn)朋友電腦塞滿了流氓軟件,數個可疑進程占據了大量的CPU資源,我只好告訴他,殺殺毒,重裝下系統(tǒng)再試試吧… ——相信很多朋友都遇到過電腦越用越慢、應用卡頓等情況,很多時候其實不必過于糾結問題到底出在哪,通過重裝系統(tǒng)“大法”一般都能解決。 但如果企業(yè)的IT基礎架構出現(xiàn)了反應遲鈍、性能下降等問題,重裝系統(tǒng)“大法”可就萬萬行不通了,那么,IT管理員如何才能快速的找到系統(tǒng)中的“癥結”所在? DPACK,給管理員一雙“慧眼” 很多時候,企業(yè)IT管理員們都會發(fā)出類似的感慨: 為什么測試時有幾十萬的IOPS,實際跑數據庫為什么非常慢?為什么買了***端的存儲,帶寬卻只有不到十MB?剛剛升級了存儲,為什么應用還是響應緩慢? 這些難以確定的問題著實會讓IT管理員們感到惱火,如若沒有多年的運維管理經驗,或是對系統(tǒng)運行狀況有著全局性的了解,很難一下子定位到系統(tǒng)瓶頸。 那么,有沒有一種方法,讓IT管理員能夠一目了然的洞悉IT環(huán)境? 答案是肯定的!戴爾提供了一款免費的小工具——性能分析和收集工具包DPACK (Dell Performance Analysis Collection Kit),其目標就是讓管理員能夠對IT系統(tǒng)了如指掌! DPACK主要具有以下這些能力: 收集分析主機端性能信息 幫助用戶理解工作負載的性能,也可協(xié)助進行存儲解決方案的規(guī)劃和選型 收集所需的數據并生成專業(yè)報告(涵蓋多種不同語言) 幫助客戶更好了解自己的環(huán)境,做出明智的業(yè)務決策 簡而言之,DPACK有著三大絕招:收集、分析、生成報告。 先看收集功能。DPACK雖然是一個免費的小工具,并且無需代理服務器,但它在收集系統(tǒng)信息方面的能力卻非常強悍,遠遠超出很多傳統(tǒng)信息收集工具。 如下表,傳統(tǒng)工具往往只能收集系統(tǒng)的I/O數、吞吐量等少量信息,對操作系統(tǒng)支持也不完善;DPACK卻能收集CPU、內存、I/O、磁盤隊列長度、容量等多個指標,并且支持Windows、Linux、Unix、VMware甚至Solaris操作系統(tǒng)。 再看分析功能。光收集出一堆數據讓管理員自行去分析?No,要從一大堆枯燥的數據中看出系統(tǒng)問題,不但是一件非常耗費時間的事情,也十分考驗管理員的經驗。DPACK的另一個絕活是能夠從“全局”角度去分析系統(tǒng)的負載情況,從而讓管理員能夠洞悉系統(tǒng)的真實負載,而不被數據表面所迷惑。 舉個例子,比如某企業(yè)的存儲系統(tǒng)同時運行著SQL Server、Exchange、FileServer、WebServer等多個負載,很多傳統(tǒng)工具在收集和分析存儲需求的時候都是獨立收集和獨立分析,然后進行簡單疊加,這樣的話其實并不能真實反映存儲的真實負載。 傳統(tǒng)工具一般都是將負載簡單疊加, 但這并不能反應真實的負載情況 DPACK則能夠進行全局的、宏觀的負載分析。例如,SQL Server、Exchange、FileServer、WebServer這些應用的負載峰谷不一定會出現(xiàn)在同一個時間點,如果僅僅將負載簡單疊加,并不能反映出存儲負載的真實情況。 如果將負載簡單疊加,表面上所看到的IOPS總需求是305+250+157+200=912,但是事實上,從全局角度來看,這些應用的IOPS匯總后只需要535,峰值出現(xiàn)在11:03 再看生成報告。DPACK使用起來很簡單,只需三步:登錄DPACK支持網站、遠程或本地收集信息、用戶生成*.iokit文件郵寄給戴爾工程師來創(chuàng)建報告。DPACK2.0則進一步簡化了生成報告的操作,用戶可以直接將收集的日志數據同步上傳到DPACK網站,請求Dell銷售人員代為生成報告,之后可以在線查看報告。 DPACK能生成兩種報告,一種報告匯總了各個不同服務器的資源需求,如果這些工作負載已整合成共享資源,則還會對它們進行模擬;另一種報告是關于各個服務器的深入報告,供IT管理員搜尋需要通過新設計來改進的潛在瓶頸或熱點問題。 通過可視化的報告,IT管理員能夠很輕易的發(fā)現(xiàn)IT系統(tǒng)中的瓶頸和癥結。例如,DPACK能夠顯示單臺服務器的CPU和內存的峰值/***值、隊列深度、延遲、平均IO、總容量、可用/已用容量、讀寫比例等信息,通過這些參數能夠很清晰的看到服務器是否過載、資源是否充分利用、讀寫是否均衡等。 例如,如果服務器偶爾出現(xiàn)延遲高峰,一般沒有太大問題,也很難避免;但是如果出現(xiàn)持續(xù)的延遲高峰,可能表示服務器方案設計的性能未達到要求。再如,持續(xù)的高隊列深度可能表明系統(tǒng)已“受到磁盤的制約”或者已經在超負荷工作,存儲系統(tǒng)的能力規(guī)模過小。 DPACK就像一雙“慧眼”,指出癥結,幫助管理員及時彌補瓶頸,讓系統(tǒng)一直維持在健康的運行狀態(tài)。 DPACK,幫領導省錢“精打細算” 除了能夠幫助管理員找到系統(tǒng)瓶頸和癥結,DPACK另一個強大的能力是讓企業(yè)IT部門具有全局觀,對IT基礎架構的下一步擴容、上云做出更明智的決策,也能避免過度投資,導致資源浪費。 一個真實的例子 某企業(yè)建設了VDI環(huán)境,支撐超過二百個用戶。該企業(yè)對于成本敏感,故而全部采用了10K SAS硬盤,理論上足以滿足所需的IOPS。結果是,客戶忽略了群起風暴,導致早上上班時段只能分批啟動虛擬桌面,每批次耗時40分鐘,總計兩小時啟動時間。 該用戶的問題在于對于即將到來的存儲負載情況沒有進行很好地預估,沒有真正摸清自己的系統(tǒng)狀況,導致理論和現(xiàn)實之間出現(xiàn)了巨大的差異。 DPACK能夠很好地幫助企業(yè)避免這種情況。它不僅能對單個服務器進行信息收集、分析和生成報告,還能對所有服務器在信息收集期間的運行數據進行匯總,以高度精確的方式模擬復合工作負載將在虛擬環(huán)境上呈現(xiàn)的總運行狀況,生成報告摘要,其中包含了總吞吐量、總IOPS、總讀/寫比率、總容量等信息——這個信息非常關鍵,能夠幫助企業(yè)更加明智的做出存儲規(guī)劃決策。 例如,MB/s指的是每秒傳輸的數據量,該數據與傳輸大小和 IOPS 數相關;業(yè)界公認的公式是IOPS x 傳輸大?。ㄗ止?jié)數)= 每秒字節(jié)數(答案通常轉換為 MB/s)。如果MB/s 這個指標沒有得到正確的了解,經常會導致過度投資,而正確利用這一指標,企業(yè)就可以更加精準的規(guī)劃連接存儲系統(tǒng)所需的帶寬大小。 所以,通過DPACK,企業(yè)IT部門可以“精打細算”,既滿足業(yè)務的需要,又能實現(xiàn)更好的成本效益。 對于DPACK,戴爾曾經給出一些應用上的小建議: 如果您預期某天會出現(xiàn)性能高峰,建議在那一天運行DPACK信息收集! 不建議在低工作量時期執(zhí)行DPACK (報告會沒有意義?。?/p>
建議DPACK收集超過一天,因為24小時內能收集的有用信息太有限了! 收集總持續(xù)時間可以最長7天! 不要長期使用老版本的DPACK軟件!收集分析主機端性能信息 DPACK有頻繁的更新和增強新功能,記得下載新版本! 恐懼來源于未知,IT亦如此。 網絡上曾經流傳過這樣一張圖片,一位IT管理員對著一排機架下跪燒香,祈禱這些基礎設施能夠穩(wěn)定運行,不出毛病。 我想,除了搞笑之外,這張圖也傳達了IT管理員們一種普遍的心態(tài),即對于IT基礎架構各種疑難雜癥的無奈、迷茫,甚至說恐懼。 但是,如果能夠洞察一切,提早做出預判,那管理員們對IT還會懷有恐懼么?DPACK就是這樣一個工具,幫助IT管理員們打破未知,讓IT盡在掌控之中。