成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

終于有人把MPP大數(shù)據(jù)系統(tǒng)架構(gòu)講明白了

大數(shù)據(jù) 新聞
從資源管理角度來看,當前的大數(shù)據(jù)系統(tǒng)架構(gòu)主要有兩種:一種是MPP數(shù)據(jù)庫架構(gòu),另一種是Hadoop體系的分層架構(gòu)。這兩種架構(gòu)各有優(yōu)勢和相應的適用場景。另外,隨著光纖網(wǎng)絡通信技術(shù)的發(fā)展,大數(shù)據(jù)系統(tǒng)架構(gòu)正在向存儲與計算分離的架構(gòu)和云化架構(gòu)方發(fā)展。

?本文首先回顧并行硬件架構(gòu)的發(fā)展,并進一步介紹基于并行硬件架構(gòu)的數(shù)據(jù)庫一體機系統(tǒng)與基于MPP架構(gòu)的數(shù)據(jù)庫軟件系統(tǒng)。數(shù)據(jù)庫一體機系統(tǒng)在銀行等大型企業(yè)中采用廣泛,一體機的優(yōu)點是開箱即用、功能豐富、穩(wěn)定、售后服務好,缺點是價格昂貴、擴展不靈活。基于普通服務器集群加MPP數(shù)據(jù)庫軟件構(gòu)建的數(shù)據(jù)庫系統(tǒng),優(yōu)點是硬件成本低、水平擴展容易、易于進行海量數(shù)據(jù)處理、吞吐量高,缺點是僅適合用于數(shù)據(jù)分析。

01并行硬件架構(gòu)的發(fā)展

為了提高計算機系統(tǒng)的處理能力,在處理單元(CPU)性能確定的情況下,就需要增加處理單元的數(shù)量,此時從計算單元(CPU)對資源(特別是內(nèi)存)訪問的角度來看,并行硬件架構(gòu)分為三種,詳細說明如下。

SMP(Symmetric Multi Processing,對稱多處理器)架構(gòu)。這里的“對稱”是指所有處理器之間是平等的,并且共享包括物理內(nèi)存在內(nèi)的所有資源,處理器訪問不同資源的能力(速度)是一致的,每個處理器訪問內(nèi)存中的任何地址所需的時間是相同的,因此SMP架構(gòu)也被稱為UMA(Uniform Memory Access,一致存儲器訪問)架構(gòu)。

  • NUMA(Non-Uniform Memory Access,非一致存儲訪問)架構(gòu)。NUMA架構(gòu)服務器內(nèi)部有多個處理模塊(節(jié)點),每個模塊有多個CPU和本地內(nèi)存,但每個CPU也可以訪問整個系統(tǒng)的內(nèi)存,當然訪問本模塊的內(nèi)存要比訪問其他模塊內(nèi)存的速度快,這也是非一致存儲訪問架構(gòu)名稱的由來。

  • MPP(Massively Parallel Processing,大規(guī)模并行處理)架構(gòu)。MPP架構(gòu)是將多個處理節(jié)點通過網(wǎng)絡連接起來,每個節(jié)點是一臺獨立的機器,節(jié)點內(nèi)的處理單元獨占自己的資源,包括內(nèi)存、硬盤、IO等,也就是每個節(jié)點內(nèi)的CPU不能訪問另一個節(jié)點的內(nèi)存(這是MPP與NUMA的主要區(qū)別),MPP架構(gòu)服務器需要通過軟件實現(xiàn)復雜的調(diào)度機制以及并行處理過程。

這三種技術(shù)架構(gòu)的發(fā)展是一個并行能力、擴展能力逐漸提高的過程,也是耦合度逐漸減低的過程,它們的區(qū)別如圖1所示。SMP架構(gòu)服務器的主要問題是擴展能力十分有限,隨著CPU數(shù)量的增加,內(nèi)存訪問沖突出現(xiàn)的概率會快速增加。實驗表明,SMP架構(gòu)服務器CPU利用率最好的情況是服務器內(nèi)有2~4個CPU。NUMA架構(gòu)可以在一個物理服務器內(nèi)最多集成上百個CPU,但由于訪問非本節(jié)點內(nèi)存的延時遠遠超過本地內(nèi)存,因此在CPU達到一定數(shù)量后,無法再通過增加CPU實現(xiàn)系統(tǒng)性能的線性提高。MPP架構(gòu)的擴展性最好,理論上對節(jié)點數(shù)量沒有什么限制,可以包含幾百個節(jié)點。

圖片

▲圖1 并行硬件架構(gòu)對比

02基于并行硬件架構(gòu)的數(shù)據(jù)庫設備

數(shù)據(jù)庫廠商推出了很多軟硬件一體的數(shù)據(jù)庫設備產(chǎn)品,此類產(chǎn)品是由一臺或多臺主機組成的集成設備,將服務器、存儲、操作系統(tǒng)和數(shù)據(jù)庫軟件集成在一起,可以實現(xiàn)開箱即用。國內(nèi)一般將此類產(chǎn)品稱為數(shù)據(jù)庫一體機(Database Machine)。

為了提高性能,此類產(chǎn)品都會采用并行硬件架構(gòu)。從資源共享角度來看,這類產(chǎn)品的數(shù)據(jù)庫架構(gòu)可分成三類,詳細說明如下。

  • 完全透明共享(Shared Everthing)系統(tǒng)。一般是針對單個主機,采用SMP或者NUMA硬件架構(gòu),是一個高性能的單臺服務器,此類產(chǎn)品可以提供較高的事務處理能力。

  • 完全不共享(Shared Nothing)系統(tǒng)。由多個主機組成,采用MPP硬件架構(gòu),各節(jié)點都有自己私有的CPU、內(nèi)存、硬盤等,不存在共享資源,每個節(jié)點是一臺SMP服務器,在每個節(jié)點內(nèi)都有操作系統(tǒng)和管理數(shù)據(jù)庫的實例副本,管理本節(jié)點的資源,節(jié)點間通過網(wǎng)絡通信,能夠處理的數(shù)據(jù)量更大,適合復雜的數(shù)據(jù)綜合分析,對事務支持較差。

  • 共享磁盤(Shared Disk)系統(tǒng)。由多個主機組成,也屬于MPP硬件架構(gòu),各節(jié)點使用自己私有的CPU和內(nèi)存。共享磁盤系統(tǒng)可實現(xiàn)高可用性,即使一個節(jié)點故障,也可以通過其他節(jié)點訪問所有數(shù)據(jù),但由于節(jié)點之間不共享內(nèi)存,需要一個鎖管理器來維護節(jié)點緩存之間的一致性,會帶來額外的開銷。

這三類產(chǎn)品的功能特點對比如下表所示。

▼表1 三類產(chǎn)品的功能特點對比

圖片

?

03基于MPP架構(gòu)的數(shù)據(jù)庫軟件系統(tǒng)

基于MPP架構(gòu)的數(shù)據(jù)庫軟件系統(tǒng),一般簡稱為MPP數(shù)據(jù)庫,它是運行在由普通商用服務器組成的服務器集群上,服務器(節(jié)點)之間通過網(wǎng)絡連接,每一個節(jié)點都是獨立的、自我管理的,且計算節(jié)點的功能是相同的。也就是說,每個節(jié)點是一臺相對獨立的數(shù)據(jù)庫服務器,節(jié)點上運行著一個單機操作系統(tǒng)和數(shù)據(jù)管理系統(tǒng),用于管理本節(jié)點上的資源與數(shù)據(jù),即節(jié)點資源私有。以基于PostgreSQL的MPP數(shù)據(jù)庫系統(tǒng)Greenplum為例,每個節(jié)點上實際運行著一個單機版的PostgreSQL數(shù)據(jù)庫實例。如果是主從模式,由管理節(jié)點接收客戶端請求并將任務分解分派到多個節(jié)點上,在每個節(jié)點上完成數(shù)據(jù)讀取和計算后,再將各部分的中間結(jié)果匯總到管理節(jié)點一起計算,得到最終的結(jié)果并返回客戶端。如果是環(huán)形模式,則每個節(jié)點都可以接收客戶端的請求,并向其他節(jié)點請求數(shù)據(jù),待完成匯總計算后將結(jié)果返回客戶端。MPP數(shù)據(jù)庫架構(gòu)(主從模式或環(huán)形模式)如圖2所示。

圖片

▲ 圖5-2 MPP數(shù)據(jù)庫架構(gòu)(主從模式或環(huán)形模式)

從硬件架構(gòu)上來說,MPP數(shù)據(jù)庫與Shared Nothing+MPP的數(shù)據(jù)庫一體機是一樣的,區(qū)別是服務器硬件選擇不限定廠商,集群彈性伸縮更靈活,成本更低。在大多數(shù)情況下,所有節(jié)點都使用相同的硬件和相同的操作系統(tǒng)。?

責任編輯:張燕妮 來源: 數(shù)倉寶貝庫
相關(guān)推薦

2020-11-30 08:34:44

大數(shù)據(jù)數(shù)據(jù)分析技術(shù)

2022-06-26 18:52:02

Hadoop大數(shù)據(jù)系統(tǒng)

2022-04-22 11:26:55

數(shù)據(jù)管理架構(gòu)

2025-05-29 01:00:00

數(shù)據(jù)架構(gòu)大數(shù)據(jù)數(shù)據(jù)湖

2021-06-29 11:21:41

數(shù)據(jù)安全網(wǎng)絡安全黑客

2022-01-05 18:27:44

數(shù)據(jù)挖掘工具

2022-04-12 18:29:41

元數(shù)據(jù)系統(tǒng)架構(gòu)

2022-03-27 20:32:28

Knative容器事件模型

2021-10-09 00:02:04

DevOps敏捷開發(fā)

2021-06-13 12:03:46

SaaS軟件即服務

2021-12-03 18:25:56

數(shù)據(jù)指標本質(zhì)

2022-04-27 18:25:02

數(shù)據(jù)采集維度

2020-08-17 08:17:00

大數(shù)據(jù)人工智能技術(shù)

2022-03-15 17:12:03

大數(shù)據(jù)機器學習人工智能

2022-10-14 18:22:18

KafkaHiveZooKeeper

2021-10-20 18:49:29

架構(gòu)分布式系統(tǒng)

2022-04-18 07:37:30

數(shù)據(jù)信息知識

2020-10-29 06:09:37

數(shù)據(jù)中臺數(shù)據(jù)大數(shù)據(jù)

2022-05-09 20:23:51

數(shù)據(jù)采集

2021-10-07 20:24:16

AIBI大數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 狠狠躁18三区二区一区 | 丝袜美腿一区二区三区动态图 | 精品免费国产视频 | 亚洲精选一区二区 | 五月天国产 | 国产成人精品在线播放 | 天堂一区在线观看 | 日本免费一区二区三区四区 | 亚洲av毛片成人精品 | 黄色三级在线播放 | 色婷婷亚洲国产女人的天堂 | 人人看人人草 | 人成在线视频 | 日韩欧美在线观看视频 | 日韩在线免费看 | 老司机67194精品线观看 | 国产一级视屏 | 国产免费视频 | 91亚洲精品国偷拍自产在线观看 | 精品国产不卡一区二区三区 | 久久最新网址 | 一级免费毛片 | 久久久久亚洲精品 | 亚洲精品2区 | 欧美日韩专区 | 久久在线看 | 中文字幕丁香5月 | 三级在线免费观看 | 在线免费观看毛片 | 一区二区三区视频免费看 | 亚洲视频 欧美视频 | 中文字幕av在线 | 久久久九九九九 | 动漫www.被爆羞羞av44 | 男人av在线播放 | 国产高清视频 | 久久精品一区二区视频 | 九九成人| 国产在线www | 精品一区在线 | 亚洲欧美中文日韩在线v日本 |