Amazon Redshift簡介
隨著各種云端服務的涌現,數據倉庫領域近些年發生了劇烈變化,因為云端服務可以實現極高的性能、簡單的部署、近乎無限的可擴展性和輕松的管理方式,而成本只有內部解決方案的一小部分。因此,企業很快都在將其數據倉庫從內部遷移到云中。AWS 提供全套服務,可實施從數據收集和存儲到處理和可視化在內的整個數據倉庫工作流程。
Amazon Redshift 是一種快速且完全托管的數據倉庫,讓您可以使用標準 SQL 和現有的商業智能 (BI) 工具經濟高效地輕松分析您的所有數據。利用 Amazon Redshift,您可以使用高性能本地磁盤上的列式存儲通過復雜的查詢優化對 PB 級結構化數據運行復雜的分析查詢,并能大規模執行并行查詢。大多數結果在幾秒內返回。使用 Amazon Redshift 時,您可以從小規模開始,費用只有每小時 0.25 USD,并且無需承諾;然后將數據量擴展到 PB 級,費用為每年每 TB 1000 USD,不到傳統解決方案的十分之一。
Amazon Redshift 還包含 Redshift Spectrum,讓您可以對 Amazon S3 中的 EB 級非結構化數據直接運行 SQL 查詢。不需要加載或轉換,并且您可以使用 Avro、CSV、Grok、Ion、JSON、ORC、Parquet、RCFile、RegexSerDe、SequenceFile、TextFile 和 TSV 等開源數據格式。Redshift Spectrum 可以根據檢索的數據自動擴展查詢計算容量,因此對 Amazon S3 的查詢速度非常快,不受數據集大小的影響。
優勢
1、快速
Amazon Redshift 使用列存儲技術來改善 I/O 效率并能跨過多個節點并行查詢,可以實現快速查詢。數據加載的速度隨著集群的大小線性擴展;能夠與 Amazon S3、Amazon DynamoDB、Amazon EMR、Amazon Kinesis 和任何啟用 SSH 的主機集成。
2、價格低廉
您只需按實際使用量付費。每年每 TB 1000 USD 即可讓不限數量的用戶對您的所有數據進行不限次數的分析,成本只有傳統數據倉庫解決方案的十分之一。大多數客戶的數據大小在壓縮之后減小到原來的三分之一到四分之一,每年每 TB 未壓縮數據的成本降低到 250 – 333 USD。
3、可擴展
Redshift Spectrum 讓您可以利用現在使用的 SQL 語法和 BI 工具,對 Amazon S3 中的 EB 級數據進行查詢,就像在 Amazon Redshift 本地磁盤中存儲的 PB 級數據運行查詢一樣簡單。您可以將高度結構化并且頻繁訪問的數據存儲在 Redshift 本地磁盤中,并將大量非結構化數據存儲在 Amazon S3“數據湖”中,然后在二者范圍內進行無縫查詢。
4、簡單
借助 Amazon Redshift,您可以輕松自動執行大多數常規管理任務,以管理、監控和擴展數據倉庫。通過處理所有這些耗時耗力的任務,Amazon Redshift 使您得到了解脫并專注于您的數據和業務。
5、可擴展
只需在控制臺中單擊幾下或使用簡單的 API 調用,即可根據性能和容量需求的更改來輕松擴展和縮小集群。
6、安全
安全件是內置的。您可以使用硬件加速型 AES-256 和 SSL 加密靜態和動態數據,使用 Amazon VPC 隔離您的集群,甚至使用 AWS Key Management Service (KMS) 和硬件安全模塊 (HSM) 管理您的密鑰。
7、兼容
Amazon Redshift 支持標準 SQL 并提供自定義 JDBC 和 ODBC 驅動程序 (您可從控制臺下載這些驅動程序),從而使您能夠使用各種常見的 SQL 客戶端。您也可以使用標準的 PostgreSQL JDBC 和 ODBC 驅動程序。