成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

支撐日活百萬用戶的高并發(fā)系統,應該如何設計其數據庫架構?

數據庫 其他數據庫
這篇文章,我們來聊一下對于一個支撐日活百萬用戶的高并系統,他的數據庫架構應該如何設計?

目錄:

  • 用一個創(chuàng)業(yè)公司的發(fā)展作為背景引入
  • 用多臺服務器來分庫支撐高并發(fā)讀寫
  • 大量分表來保證海量數據下查詢性能
  • 讀寫分離來支撐按需擴容及性能提升
  • 高并發(fā)下的數據庫架構設計總結

這篇文章,我們來聊一下對于一個支撐日活百萬用戶的高并系統,他的數據庫架構應該如何設計?

看到這個題目,很多人第一反應就是:

分庫分表啊!

但是實際上,數據庫層面的分庫分表到底是用來干什么的,他的不同的作用如何應對不同的場景,我覺得很多同學可能都沒搞清楚。

一、用一個創(chuàng)業(yè)公司的發(fā)展作為背景引入

假如我們現在是一個小創(chuàng)業(yè)公司,注冊用戶就20萬,每天活躍用戶就1萬,每天單表數據量就1000,然后高峰期每秒鐘并發(fā)請求最多就10。

天哪!就這種系統,隨便找一個有幾年工作經驗的高級工程師,然后帶幾個年輕工程師,隨便干干都可以做出來。

因為這樣的系統,實際上主要就是在前期快速的進行業(yè)務功能的開發(fā),搞一個單塊系統部署在一臺服務器上,然后連接一個數據庫就可以了。

接著大家就是不停的在一個工程里填充進去各種業(yè)務代碼,盡快把公司的業(yè)務支撐起來,如下圖所示。

結果呢,沒想到我們運氣這么好,碰上個優(yōu)秀的CEO帶著我們走上了康莊大道!

公司業(yè)務發(fā)展迅猛,過了幾個月,注冊用戶數達到了2000萬!每天活躍用戶數100萬!每天單表新增數據量達到50萬條!高峰期每秒請求量達到1萬!

同時公司還順帶著融資了兩輪,估值達到了驚人的幾億美金!一只朝氣蓬勃的幼年獨角獸的節(jié)奏!

好吧,現在大家感覺壓力已經有點大了,為啥呢?

因為每天單表新增50萬條數據,一個月就多1500萬條數據,一年下來單表會達到上億條數據。

經過一段時間的運行,現在咱們單表已經兩三千萬條數據了,勉強還能支撐著。

但是,眼見著系統訪問數據庫的性能怎么越來越差呢,單表數據量越來越大,拖垮了一些復雜查詢SQL的性能啊!

然后高峰期請求現在是每秒1萬,咱們的系統在線上部署了20臺機器,平均每臺機器每秒支撐500請求,這個還能抗住,沒啥大問題。

但是數據庫層面呢?

如果說此時你還是一臺數據庫服務器在支撐每秒上萬的請求,負責任的告訴你,每次高峰期會出現下述問題:

  • 你的數據庫服務器的磁盤IO、網絡帶寬、CPU負載、內存消耗,都會達到非常高的情況,數據庫所在服務器的整體負載會非常重,甚至都快不堪重負了
  • 高峰期時,本來你單表數據量就很大,SQL性能就不太好,這時加上你的數據庫服務器負載太高導致性能下降,就會發(fā)現你的SQL性能更差了
  • 最明顯的一個感覺,就是你的系統在高峰期各個功能都運行的很慢,用戶體驗很差,點一個按鈕可能要幾十秒才出來結果
  • 如果你運氣不太好,數據庫服務器的配置不是特別的高的話,弄不好你還會經歷數據庫宕機的情況,因為負載太高對數據庫壓力太大了

二、多臺服務器分庫支撐高并發(fā)讀寫

首先我們先考慮第一個問題,數據庫每秒上萬的并發(fā)請求應該如何來支撐呢?

要搞清楚這個問題,先得明白一般數據庫部署在什么配置的服務器上。

通常來說,假如你用普通配置的服務器來部署數據庫,那也起碼是16核32G的機器配置。

這種非常普通的機器配置部署的數據庫,一般線上的經驗是:不要讓其每秒請求支撐超過2000,一般控制在2000左右。

控制在這個程度,一般數據庫負載相對合理,不會帶來太大的壓力,沒有太大的宕機風險。

所以首先第一步,就是在上萬并發(fā)請求的場景下,部署個5臺服務器,每臺服務器上都部署一個數據庫實例。

然后每個數據庫實例里,都創(chuàng)建一個一樣的庫,比如說訂單庫。

此時在5臺服務器上都有一個訂單庫,名字可以類似為:db_order_01,db_order_02,等等。

然后每個訂單庫里,都有一個相同的表,比如說訂單庫里有訂單信息表,那么此時5個訂單庫里都有一個訂單信息表。

比如db_order_01庫里就有一個tb_order_01表,db_order_02庫里就有一個tb_order_02表。

這就實現了一個基本的分庫分表的思路,原來的一臺數據庫服務器變成了5臺數據庫服務器,原來的一個庫變成了5個庫,原來的一張表變成了5個表。

然后你在寫入數據的時候,需要借助數據庫中間件,比如sharding-jdbc,或者是mycat,都可以。

你可以根據比如訂單id來hash后按5取模,比如每天訂單表新增50萬數據,此時其中10萬條數據會落入db_order_01庫的tb_order_01表,另外10萬條數據會落入db_order_02庫的tb_order_02表,以此類推。

這樣就可以把數據均勻分散在5臺服務器上了,查詢的時候,也可以通過訂單id來hash取模,去對應的服務器上的數據庫里,從對應的表里查詢那條數據出來即可。

依據這個思路畫出的圖如下所示,大家可以看看。

做這一步有什么好處呢?

第一個好處,原來比如訂單表就一張表,這個時候不就成了5張表了么,那么每個表的數據就變成1/5了。

假設訂單表一年有1億條數據,此時5張表里每張表一年就2000萬數據了。

那么假設當前訂單表里已經有2000萬數據了,此時做了上述拆分,每個表里就只有400萬數據了。

而且每天新增50萬數據的話,那么每個表才新增10萬數據,這樣是不是初步緩解了單表數據量過大影響系統性能的問題?

另外就是每秒1萬請求到5臺數據庫上,每臺數據庫就承載每秒2000的請求,是不是一下子把每臺數據庫服務器的并發(fā)請求降低到了安全范圍內?

這樣,降低了數據庫的高峰期負載,同時還保證了高峰期的性能。

三、大量分表來保證海量數據下的查詢性能

但是上述的數據庫架構還有一個問題,那就是單表數據量還是過大,現在訂單表才分為了5張表,那么如果訂單一年有1億條,每個表就有2000萬條,這也還是太大了。

?所以還應該繼續(xù)分表,大量分表。

比如可以把訂單表一共拆分為1024張表,這樣1億數據量的話,分散到每個表里也就才10萬量級的數據量,然后這上千張表分散在5臺數據庫里就可以了。

在寫入數據的時候,需要做兩次路由,先對訂單id hash后對數據庫的數量取模,可以路由到一臺數據庫上,然后再對那臺數據庫上的表數量取模,就可以路由到數據庫上的一個表里了。?

通過這個步驟,就可以讓每個表里的數據量非常小,每年1億數據增長,但是到每個表里才10萬條數據增長,這個系統運行10年,每個表里可能才百萬級的數據量。

這樣可以一次性為系統未來的運行做好充足的準備,看下面的圖,一起來感受一下:

四、讀寫分離來支撐按需擴容以及性能提升

這個時候整體效果已經挺不錯了,大量分表的策略保證可能未來10年,每個表的數據量都不會太大,這可以保證單表內的SQL執(zhí)行效率和性能。

然后多臺數據庫的拆分方式,可以保證每臺數據庫服務器承載一部分的讀寫請求,降低每臺服務器的負載。

但是此時還有一個問題,假如說每臺數據庫服務器承載每秒2000的請求,然后其中400請求是寫入,1600請求是查詢。

也就是說,增刪改的SQL才占到了20%的比例,80%的請求是查詢。

此時假如說隨著用戶量越來越大,假如說又變成每臺服務器承載4000請求了。

那么其中800請求是寫入,3200請求是查詢,如果說你按照目前的情況來擴容,就需要增加一臺數據庫服務器.

但是此時可能就會涉及到表的遷移,因為需要遷移一部分表到新的數據庫服務器上去,是不是很麻煩?

其實完全沒必要,數據庫一般都支持讀寫分離,也就是做主從架構。

寫入的時候寫入主數據庫服務器,查詢的時候讀取從數據庫服務器,就可以讓一個表的讀寫請求分開落地到不同的數據庫上去執(zhí)行。

這樣的話,假如寫入主庫的請求是每秒400,查詢從庫的請求是每秒1600,那么圖大概如下所示。

寫入主庫的時候,會自動同步數據到從庫上去,保證主庫和從庫數據一致。

然后查詢的時候都是走從庫去查詢的,這就通過數據庫的主從架構實現了讀寫分離的效果了。

現在的好處就是,假如說現在主庫寫請求增加到800,這個無所謂,不需要擴容。然后從庫的讀請求增加到了3200,需要擴容了。

這時,你直接給主庫再掛載一個新的從庫就可以了,兩個從庫,每個從庫支撐1600的讀請求,不需要因為讀請求增長來擴容主庫。

實際上線上生產你會發(fā)現,讀請求的增長速度遠遠高于寫請求,所以讀寫分離之后,大部分時候就是擴容從庫支撐更高的讀請求就可以了。

而且另外一點,對同一個表,如果你既寫入數據(涉及加鎖),還從該表查詢數據,可能會牽扯到鎖沖突等問題,無論是寫性能還是讀性能,都會有影響。

所以一旦讀寫分離之后,對主庫的表就僅僅是寫入,沒任何查詢會影響他,對從庫的表就僅僅是查詢。

五、高并發(fā)下的數據庫架構設計總結

其實從大的一個簡化的角度來說,高并發(fā)的場景下,數據庫層面的架構肯定是需要經過精心的設計的。

尤其是涉及到分庫來支撐高并發(fā)的請求,大量分表保證每個表的數據量別太大,讀寫分離實現主庫和從庫按需擴容以及性能保證。

這篇文章就是從一個大的角度來梳理了一下思路,各位同學可以結合自己公司的業(yè)務和項目來考慮自己的系統如何做分庫分表應該怎么做。

另外就是,具體的分庫分表落地的時候,需要借助數據庫中間件來實現分庫分表和讀寫分離,大家可以自己參考 sharding-jdbc 或者 mycat 的官網即可,里面的文檔都有詳細的使用描述。

責任編輯:姜華 來源: 今日頭條
相關推薦

2019-02-27 09:46:05

數據庫架構并發(fā)

2020-10-30 09:33:01

分庫分表數據庫

2023-01-18 17:50:35

系統架構Kafka

2022-09-13 18:03:35

架構系統通信

2017-11-10 09:16:07

直播彈幕系統

2024-06-19 09:34:38

系統數據庫內存

2019-02-12 09:34:00

微博短視頻架構

2011-08-23 17:12:22

MySQL支撐百萬級流

2019-01-24 09:42:55

系統高并發(fā)面試

2024-09-27 07:59:38

2020-09-16 09:08:49

訂單微服務架構

2020-02-06 08:03:53

疫情設計IM系統

2019-12-03 10:46:07

PHP高并發(fā)架構

2018-06-12 22:17:01

2019-04-16 09:40:12

服務器系統數據庫

2025-06-05 09:50:50

2019-12-13 08:52:48

高并發(fā)系統限流

2023-01-11 17:29:12

數據庫分庫分表

2021-04-28 08:52:22

高并發(fā)架構設高并發(fā)系統

2013-10-03 16:55:31

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 97超碰站 | 人人九九精 | 国产日韩欧美精品一区二区 | 亚洲欧美一区二区三区在线 | 一区在线播放 | 男人av网 | 超碰人人在线 | 成人三级av| 亚洲精品无 | av大片| 97av在线| 91不卡 | 日韩视频专区 | 久久av一区二区三区 | 欧美日韩国产精品一区 | 亚洲日韩视频 | 男人的天堂一级片 | 国产精品一区二区久久精品爱微奶 | 国产精品美女久久久久久免费 | 在线免费小视频 | 精品欧美一区二区精品久久久 | 久久亚洲一区二区三区四区 | 日本 欧美 三级 高清 视频 | 夜夜爽99久久国产综合精品女不卡 | cao在线| 日日躁狠狠躁aaaaxxxx | 久久国产精品72免费观看 | 日本久久精品视频 | 人人干人人舔 | 日韩欧美网 | 国产三区av | japan25hdxxxx日本 做a的各种视频 | 日韩av在线中文字幕 | 高清国产一区二区 | 色综合欧美| 久久精品国产久精国产 | 亚洲在线一区 | 欧美日韩三级在线观看 | 精品视频999| 免费欧美 | 国产精品久久久久久久一区探花 |