成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

MPP 與 SMP 的區別,終于有人講明白了

大數據 數據分析
MPP 需要一種復雜的機制來調度和平衡各個節點的負載和并行處理過程,通信復雜。當通信時間長時, MPP 性能會變差。目前一些基于 MPP 技術的服務器一般 通過系統級軟件(如數據庫)來屏蔽這種復雜性。

01SMP

SMP 是指在一個計算機上匯集了一組處理器(多核 CPU),各 CPU 之間共享內存子系統以及總線結構。代表數據庫有 Oracle 、MySQL 。SMP 架構原理圖如圖1所示。

圖片

▲圖1 SMP 架構原理圖

SMP 的典型特征如下:

  • 每個處理器共享操作系統的一個副本 。
  • 支持共享架構。
  • 多任務并行架構,是一個緊耦合的多處理器系統。
  • 多個處理器之間共享整個工作。
  • 沒有單獨的緩存池或鎖表,全部共享。
  • 通過購買更大的系統來實現擴展。
  • 容易出現資源爭用等問題。
  • 創建分布式架構需要復雜的設計,并且只能部分實現。
  • 軟件提供的內存可用量完全取決于 RAM 和負載的數量。

在 SMP 中,每個 CPU 都有自己的緩存,無論雙核還是四核,其余資源都是共享的。SMP 的優點如下。

1 )共享單一操作系統副本。

2 )應用程序編程模式簡便。

3)管理成本低,易于維護管理。

SMP 的缺點如下。

1 )伸縮擴展能力非常有限。對 SMP 服務器進行擴展的方式包括增加內存、使用更快 的 CPU、增加 CPU、擴充 I/O(槽口數與總線數)以及添加更多的外部設備(通常是磁盤存 儲設備)。這樣的架構模式直接導致內存上線受限制。

2 )CPU 利用率低。由于每個 CPU 必須通過相同的內存總線訪問相同的內存資源,因 此隨著 CPU 數量的增加,內存訪問沖突將迅速增加,最終造成 CPU 資源的浪費,大大降 低 CPU 性能的有效性。

3)總線有瓶頸。當大型程序的處理要求大于共享總線時,總線就沒有能力進行處理 了,這時共享的總線就成為性能瓶頸。

4 )容錯性和效率較低。

SMP 的典型應用場景是托管小型網站和電子郵件服務器等。

02分布式MPP計算架構

MPP(Massively Parallel Processing,大規模并行分析處理)架構模式,是典型的分布 式計算模式。MPP 的各節點不共享資源,每個執行節點可以獨自完成數據的讀取和計算。

MPP 架構核心原理如下。

1 )將數據集分布在許多機器或節點上,以處理大量數據。

2 )每個節點都有獨立的磁盤存儲系統和內存系統。

3 )業務數據根據數據庫模型和應用特點劃分到各個節點上。

4 )每個數據節點通過專用網絡或者商業通用網絡互相連接,彼此協同計算,作為整體 提供數據庫服務。

在 MPP 架構中,各節點都包含自己的存儲和計算功能,可以獨立執行查詢的一部分。 最后,在內存里進行數據合并,并將結果返回客戶端。MPP 具有可伸縮、高可用、高性能、 資源共享等優勢。

MPP 由許多松耦合的處理單元組成。注意,這里是指處理單 元而不是處理器。每個單元內的 CPU 都有自己私有的資源,如總線、內存、硬盤等。每個 單元內都有操作系統和管理數據庫實例。這種結構最大的特點在于不共享資源。代表數據庫  有 ClickHouse 、Snowflake 、Azure Synapse Analytics 、Impala 、Greenplum 、Elasticsearch、 Presto 。MPP 架構原理圖如圖2所示。

圖片圖片

▲圖2 MPP架構原理圖

MPP 典型特征如下:

  • 每個處理器都使用自己的操作系統和內存。
  •  支持無共享架構。
  •  多個處理器對單個任務進行協調處理。每個處理器處理任務的不同部分。
  • 每個節點只負責處理自己磁盤上的任務。
  • 每個節點維護自己的一組鎖表和緩存池,增加了內存功能的可用性。
  • 只需添加機架即可輕松實現可擴展性,支持 TB 到 PB 數據量級的水平擴展。
  • 完全不共享資源,所以不存在資源爭用。
  • 被設計為分布式架構。
  • 數據被水平分區,壓縮率高,以最佳方式使用內存。
  • 處理器使用消息進行通信。

MPP 的優點如下。

1 )每個處理器都使用自己的操作系統和內存。

2 )性能好。大規模數據并行處理能力優秀,適合于復雜的大型數據分析與處理場景。 

3)可伸縮。在 MPP 增加節點時,MPP 的性能可以線性擴展。MPP 在數據倉庫決策支持和數據挖掘方面占據優勢。

4 )低成本。基于 MPP 的數據倉庫解決方案旨在廉價的商用硬件上運行,不需要可能 包含成本的企業級雙冗余組件。

5 )高可用。使用自動數據復制來提高系統彈性并確保高可用性。

6)高吞吐量。MPP 可以實現非常高的吞吐量,因為讀寫操作可以在集群中的獨立節點 上并行執行。

MPP 的缺點如下。

1 )管理成本高。MPP 需要一種復雜的機制來調度和平衡各個節點的負載和并行處理過 程,通信復雜。當通信時間長時, MPP 性能會變差。目前一些基于 MPP 技術的服務器一般 通過系統級軟件(如數據庫)來屏蔽這種復雜性。

2 )短板效應:如果遇到“短板”節點,整個引擎的性能將下降到該短板節點的能力(木桶的短板)。MPP 架構不適合異構的機器,它要求各節點配置相同。

MPP 的典型應用場景是數據倉庫、大規模數據處理和數據挖掘等。

關于作者:陳光劍,資深大數據專家、后端技術專家和架構師,擁有超過10年的技術研發和管理經驗,一線實戰經驗豐富。現就職于字節跳動,曾就職于阿里巴巴,主要從事企業智能數字化經營管理、電商智能數字化運營等系統架構設計和研發工作。

責任編輯:武曉燕 來源: 數倉寶貝庫
相關推薦

2022-12-28 18:31:43

Hive性能分布式表

2022-06-21 11:14:51

大數據系統架構

2022-03-27 20:32:28

Knative容器事件模型

2021-10-09 00:02:04

DevOps敏捷開發

2021-06-13 12:03:46

SaaS軟件即服務

2021-10-17 20:38:30

微服務內存組件

2021-12-03 18:25:56

數據指標本質

2021-03-25 11:24:25

爬蟲技術開發

2020-11-03 07:04:39

云計算公有云私有云

2022-04-27 18:25:02

數據采集維度

2021-08-31 19:14:38

技術埋點運營

2021-10-12 18:31:40

流量運營前端

2021-09-03 18:38:13

數據湖數據倉庫

2021-09-26 15:58:05

MySQL SQL 語句數據庫

2022-05-01 22:09:27

數據模型大數據

2021-06-29 11:21:41

數據安全網絡安全黑客

2022-07-31 20:29:28

日志系統

2020-11-30 08:34:44

大數據數據分析技術

2022-01-05 18:27:44

數據挖掘工具

2021-03-03 21:31:24

量化投資利潤
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品国产一区二区三区久久 | 伦理片97 | 亚洲国产精品一区二区第一页 | 在线观看亚洲专区 | а天堂中文最新一区二区三区 | 国产高清无av久久 | 欧美一区二区三区视频在线播放 | 91久久久精品国产一区二区蜜臀 | 亚洲欧美在线视频 | 人人干人人舔 | 午夜天堂精品久久久久 | 精品视频一区二区三区在线观看 | 成人h片在线观看 | 国产黄色一级电影 | 亚洲一区二区三区四区五区午夜 | 久久久一二三区 | 国产精品视频一区二区三区四区国 | 91精品国产综合久久久久久丝袜 | 国产精品国产a | av天天干 | 99视频免费| 国产精品视频区 | 国产精品一区二区福利视频 | 亚洲成人黄色 | 免费久久网| 国产成在线观看免费视频 | 成人欧美在线 | 中文字幕亚洲精品 | 国产精品中文字幕在线观看 | 伊人焦久影院 | 日日操夜夜操视频 | 日韩国产专区 | 99久久精品国产一区二区三区 | 一级一片在线观看 | 国产精品区二区三区日本 | 九九九视频精品 | www亚洲一区 | 亚洲最新网址 | 国产精品国产精品国产专区不片 | 欧美日韩综合视频 | 久久婷婷国产麻豆91 |