初志存儲(chǔ)助力中國(guó)科學(xué)院基因組研究所
用戶背景介紹
基因組關(guān)乎我們?nèi)祟惿械膴W秘。目前,生命科學(xué)的發(fā)展已進(jìn)入基因組學(xué)的時(shí)代,隨之而來(lái)產(chǎn)生了海量的數(shù)據(jù)。面對(duì)生命科學(xué)、醫(yī)學(xué)的重大科學(xué)前沿問(wèn)題,基因所要深度挖掘海量數(shù)據(jù)、建立新的數(shù)學(xué)模型,從全基因組水平、系統(tǒng)水平研究探索生物學(xué)規(guī)律。為了更好的進(jìn)行數(shù)據(jù)分析、計(jì)算模擬等方面的工作,中科院北京基因所采用了初志A2000集群存儲(chǔ)系統(tǒng)解決方案。
用戶需求點(diǎn)分析
為滿足生物計(jì)算平臺(tái)的基因計(jì)算需要,預(yù)建設(shè)兩套與計(jì)算集群相連接的大規(guī)模存儲(chǔ)系統(tǒng),以支撐海量數(shù)據(jù)的大規(guī)模計(jì)算,完成基因分析的實(shí)驗(yàn)課題。一是需要匹配前端計(jì)算集群的在線數(shù)據(jù)存儲(chǔ);二是匹配后端調(diào)用基因序列圖譜的存儲(chǔ)資源池。
項(xiàng)目方案:初志如何助力基因所
針對(duì)用戶對(duì)預(yù)建設(shè)的大規(guī)模存儲(chǔ)系統(tǒng)的訴求,初志有針對(duì)性的提供了基于A2000的集群存儲(chǔ)架構(gòu)系統(tǒng)的解決方案。
首先,在線數(shù)據(jù)存儲(chǔ)需要匹配前端計(jì)算集群,要求高I/O即高帶寬來(lái)提高海量數(shù)據(jù)的查詢系統(tǒng)和工作效率。A2000采用每節(jié)點(diǎn)300MB/s的高I/O存儲(chǔ)節(jié)點(diǎn)單元組成并行存儲(chǔ)集群,實(shí)現(xiàn)高達(dá)12GB/s的聚合帶寬,全面支撐前端高性能計(jì)算集群對(duì)存儲(chǔ)調(diào)用帶寬的要求,達(dá)到數(shù)據(jù)即時(shí)傳遞,敏捷運(yùn)算,高效輸出。滿足海量數(shù)據(jù)的大規(guī)模計(jì)算需要,完成基因分析的實(shí)驗(yàn)課題。
其次,為了匹配后端調(diào)用基因序列圖譜,搭建一個(gè)存儲(chǔ)資源池,滿足存儲(chǔ)容量的要求,A2000采用每節(jié)點(diǎn)36TB的大容量存儲(chǔ)單元進(jìn)行存儲(chǔ)資源池的搭建,為基因所提供了一個(gè)海量的存儲(chǔ)空間,并預(yù)留了PB級(jí)擴(kuò)容空間,為日后的發(fā)展打下基礎(chǔ),保障了未來(lái)擴(kuò)展的持續(xù)性。
另外,除了滿足用戶業(yè)務(wù)的訴求外還做到了易管理,實(shí)現(xiàn)了前端計(jì)算存儲(chǔ)集群與后端存儲(chǔ)資源池的整合,進(jìn)行一體化統(tǒng)一管理,極大地方便了系統(tǒng)管理員對(duì)全局存儲(chǔ)的把控管理。不僅如此,A2000采用HPC系統(tǒng),具有可擴(kuò)展性,能夠使存儲(chǔ)系統(tǒng)隨著HPC系統(tǒng)的擴(kuò)展而擴(kuò)展。
同時(shí),A2000采用業(yè)界最快速的光模塊萬(wàn)兆存儲(chǔ)網(wǎng)絡(luò)進(jìn)行網(wǎng)絡(luò)的連通,實(shí)現(xiàn)了真正意義的高效,快速,前沿的大規(guī)模存儲(chǔ)系統(tǒng)。
客戶收益
由于基因組學(xué)的相關(guān)學(xué)科的大幅發(fā)展,基因組學(xué)對(duì)生物醫(yī)學(xué)、農(nóng)學(xué)、藥學(xué)、環(huán)境科學(xué)的影響將會(huì)極為深遠(yuǎn)。在技術(shù)進(jìn)步的影響下,基因組的研究工作更能御風(fēng)而行,事半功倍。
通過(guò)初志的A2000集群存儲(chǔ)系統(tǒng)的實(shí)施,基因組研究所一方面提高了帶寬,保證海量數(shù)據(jù)的大規(guī)模運(yùn)算;另一方面,A2000的高安全性能,保障了精密科研單位研究成果的安全。同時(shí),系統(tǒng)的易操作管理也使基因組研究所在管理上方便省心,易擴(kuò)展性更是為未來(lái)的發(fā)展打下基礎(chǔ),滿足用戶后續(xù)發(fā)展。