詳解Amazon Redshift
11月底,AWS推出了數據倉庫服務Redshift,除了價格便宜,Redshift還有諸多特點,甚至你根本不需要雇傭數據庫管理員。以下為James Hamilton對Redshift的評論:

快速 強大——Redshift有大量創新,提供非常高的數據請求性能,支持從幾百GB到PB或更多。首先,它采用列式存儲和壓縮技術。第二,硬件對數據倉庫進行優化,使用附加的本地存儲和萬兆網卡連接每個節點。最后,使用了大規模并行處理(MPP)架構,可以在不停機的情況下實現擴展或收縮。
擴展性——有兩種節點類型可選,一種為特大節點(XL),擁有2TB的壓縮存儲空間,另一種為8倍特大節點(8XL),擁有16TB壓縮存儲空間。起初,你可以從1個特大節點起步,最大擴展到總共100個8倍特大節點的集群。特大節點集群可擁有1到32個節點,8倍特大集群可以擁有2到100個節點。
通過AWS管理控制臺或API,可以輕松的調整節點數量,并且這一過程不需要停機。目前Redshift處在有限預覽階段,并不支持調整重新設定空間,正式版將提供這一功能。
高性價比——你可以選擇按需付費或長期合同,或通過保留實例獲得更低的價格。在按需付費方式下,2TB的數據倉庫的價格為0.85美元/小時,價格節點數量隨擴展線性增長。保留實例的價格為0.228美元/小時,折合每年1000美元/TB。
全方位管理——Redshift對所有的設置、運維、擴展進行管理,貫穿數據倉庫從建立到集群備份,以及安裝補丁或升級。所有這些耗費精力的操作都交由Amazon來處理。
安全——Redshift支持SSL加密,可通過網頁界面對訪問數據倉庫網絡的防火墻進行設置,并支持在數據倉庫集群中創建用戶。當Redshift正式發布后,計劃支持靜止數據加密(encrypting data at rest)和Amazon虛擬私有云(Amazon VPC)。
可靠性——所有寫入節點的數據,都將自動的在集群內的節點進行備份,并不間斷的在S3進行備份。Redshift對集群的健康持續關注,并自動替換任何組件。
兼容性——Redshift通過了JasperSoft和Microstrategy認證,可以使用PostgreSQL JBDBC或ODBC將SQL客戶端或智能工具與Redshift數據倉庫連接。
寫在最后
毫無疑問,對于價格敏感的用戶,Redshift的吸引力足夠強大。但我還是會問許多問題?數據安全如何保證?S3僅能提供99.9%的可用性,與金融行業的標準相去甚遠。今年和去年頻發的宕機,讓許多AWS用戶心有余悸。有些充滿智慧的用戶摸索出一套跨可用區備份的經驗,能大大提高可用性,但這需要幾年時間進行摸索、試錯和優化。對于計劃嘗鮮Redshift的用戶,首先需要在本地保存好數據,并準備一只強大的運維隊伍以及足夠的寬容心。