數據倉庫DWS與數據庫RDS、MapReduce的區別
華為云618年中云鉅惠,大數據+AI專場熱銷中,精選10+大數據、AI產品,有很多朋友對于數據倉庫DWS、數據庫RDS、MapReduce這3個服務“傻傻”分不清楚,下面就圖文結合介紹三個產品之間的區別,如何根據業務場景選擇適合的產品。
一、DWS與RDS的核心區別
RDS是OLTP數據庫。RDS用于支撐日常的業務活動,市場上典型產品是Mysql、Oracle,側重于高并發、數據頻繁增刪改,RDS不擅長做數據分析。但由于使用習慣的原因,存在不少客戶還使用Mysql、Oracle進行數據分析,但其架構限制,對海量數據加載、快速查詢分析性能較差,是DWS替換的重要目標場景之一。
DWS是OLAP數據庫,主要是數據倉庫和數據集市,主打海量存儲、數據分析統計,側重決策支持。市場上典型產品是Teradata,Greenplum,Gbase 8a、阿里ADB等。
特性 |
RDS(面向OLTP) |
DWS(面向OLAP) |
用戶 |
操作人員 |
決策人員,高級管理人員 |
功能 |
日常操作處理 數據高頻增刪改 |
用于數據分析 數據入庫后修改少、刪除少 |
設計 |
面向應用 |
面向主題 |
數據 |
最新的,細節的,二維的,分立的 |
歷史的,集成的,多維的,統一的 |
存取 |
讀/寫數十條記錄 |
讀上百萬條記錄 |
工作范圍 |
簡單的讀寫 |
復雜的查詢、求和、匯總 |
數據庫大小 |
GB~百GB |
百GB~PB級別 |
二、與大數據MapReduce(Hadoop)的區別,以及融合協作的價值
DWS與MapReduce是兩類產品、兩個生態、使用復雜度不一樣。
DWS是數據庫生態,使用標準SQL;更適合海量關系型數據分析,性能極高,適合多維度數據自助分析、交互式查詢分析、數據集市,毫秒級~分鐘級響應;
MapReduce是Hadoop生態,在處理非結構化和半結構化數據上具備優勢,尤其適合海量數據立項批處理場景,非結構化數據分析(日志分析、文本分析)等,一般適用于小時級~天級離線分析。
DWS + MapReduce可混搭使用形成解決方案。用DWS處理TB~PB級別的、高質量的結構化數據,同時為應用提供豐富的SQL和事務支持能力;用MapReduce實現半結構化、非結構化數據處理。這樣可以同時滿足結構化、半結構化和非結構化數據的高效處理需求。華為云DWS加上MapReduce形成的數據湖解決方案已經行業得到廣泛驗證。
作為新一代企業技術融合應用的結點,大數據成為了支持企業高速增長的新引擎。通過實時監測、跟蹤用戶行為等海量數據,對數據挖掘分析,揭示其中的規律并發現數據潛在價值,大數據成為企業提高核心競爭力的關鍵因素。
華為云618年中云鉅惠,大數據+AI專場,熱門大數據產品50元起!數據倉庫DWS:鯤鵬計算型16U64G、3節點,原價近2萬,現價僅需99.9元!MapReduce服務也為大家準備了驚喜,100元即可搶購16U32G 1個月,全場新購4折起,續訂6折起!購買產品更有V55i-B智慧屏與P40 Pro好禮相送,華為云助力企業構筑全棧大數據平臺,為商業創造無限未來。