成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

云集技術學社:數據庫概念、分類和未來

企業動態
8月5日,深信服首席算法技術專家章博在信服云《云集技術學社》系列直播課上進行了《數據庫概念、分類和未來》的分享,對數據庫基礎概念、常見數據庫種類和使用場景進行介紹,詳細解釋不同數據架構的優劣,破除常見誤區。

 8月5日,深信服首席算法技術專家章博在信服云《云集技術學社》系列直播課上進行了《數據庫概念、分類和未來》的分享,對數據庫基礎概念、常見數據庫種類和使用場景進行介紹,詳細解釋不同數據架構的優劣,破除常見誤區。

看點一:數據庫是什么?

數據庫定義

大家可能對數據庫這個詞都不陌生,我們最常說的數據庫,也就是Database這個詞,原則上它指的是按照一定格式存儲數據的文件的組合,也就是說硬盤上的數據庫的文件和數據,要按照某種特定的格式去組織,這個就是所謂的數據庫。

為了去使用數據庫,我們一般需要一整套的數據庫管理系統,也就是Database Management System (DBMS),即科學的對數據庫文件進行組織、索引、查詢、修改的一套管理軟件,常見的數據庫管理系統有MySQL、Oracle、SQL Server、DB2等。

但是僅僅DBMS本身并不能提供各種各樣的能力,我們還需要圍繞DBMS去構造由硬件操作系統、數據庫管理系統,乃至包括數據庫管理員以及相關的機制配套組成的一整套數據庫系統,才能順利的執行工作。這一套系統一般稱之為Database System。

與常見的數據管理軟件Excel相比,數據庫會管理一些更大量的數據,比如說千萬行以上的甚至億萬行以上的數據。一般Excel是單人使用的,數據庫是很多的用戶同時使用,而且可以進行高并發的訪問。此外,數據庫也有更豐富更復雜的數據處理能力,在安全機制的保障上,Excel作為一個辦公軟件只能提供密碼的基礎管理能力,而數據庫能夠提供完整的安全機制,比如說像是權限的校驗(表級別的、行級別的、列級別的權限控制),以及我們可以做一些數據備份來更好的保證數據的安全,這就是數據庫管理系統一個主要的好處。

數據庫的四個重要概念

(1)索引

數據庫經常有上百/千萬條記錄,單條查詢會很慢,而索引的功能就像新華字典的前幾頁“索引”目錄靠拼音或偏旁排序來查詢字詞,能大幅度提高查詢速度。

(2)事務

數據庫提供了一種機制,就是一件事,必須做完,如果中間出了差錯,他會清理掉一切痕跡,回到最初狀態,這對于保持數據的一致性和完整性有功不可沒的作用。

(3)聯合查詢

一份數據通常解決不了實際問題。比如有兩份數據,一份是《員工基本信息》,另一份是《工資表》,這個時候,要查詢某某員工的工資,就要結合起來做“聯合查詢”。

(4)SQL

SQL就是用來操作數據庫里數據的工具,類似吃飯時使用“筷子”獲取食物。

看點二:數據庫的分類

數據庫可以分為三個維度來分類:第一個維度是按照模型分類,可以分為關系型和非關系型的數據庫。第二個維度是根據數據庫的使用場景進行分類,主要分為事務性OLTP和分析型OLAP兩類。第三種是從數據庫架構進行分類,可以分為單點數據庫和數據庫集群。

按模型分類

按照模型劃分,一般把數據庫分成關系型和非關系型兩個類型。關系型模型由于其優秀的表達能力、嚴格的數學定義和良好的執行效率被廣泛采用,而采用關系型模型組織數據的數據庫就被稱之為關系型數據庫,如 Oracle,MySQL 等。關系型數據庫也成為了現在最主流的數據庫模型。

 

 

 

而在一個關系型的數據模型上,提供的查詢語言就是結構化查詢語言(Structured Query Language)。這樣的語言是整個數據庫現在能蓬勃發展的一個關鍵所在,因為它是高級的非過程化的編程語言,比如常見的C語言或者Python編程語言,它都是所謂的過程化編程語言,當需要它做什么的時候,需要一步一步把過程的每一個階段全部編寫好,才能夠順利的進行。但SQL是一個高級的非過程化語言,只需要用戶描述需要取得什么樣的數據,具體的執行流程就由優化器由甚至系統自動去完成了。所以整個SQL語言的學習和使用非常簡單,用戶不需要了解具體的數據組織和處理的細節,也不需要去了解如何能讓它高效的執行,所有的事情全部都是自動的。

非關系型數據庫是通過關系型以外的數據模型對數據進行組織的數據庫,通常在特定場景下具有較高的性能和可擴展性。典型 NoSQL 數據庫有:(1)鍵指數據庫:Redis、Memcache ——常用于緩存;(2)列族數據庫:HBase,Cassandra——常用于 Schema 頻繁變更的大寬表數據;(3)文檔數據庫:MongoDB —— 常用于存儲JSON文件;(4)圖數據庫:Neo4j——常用于知識圖譜等圖數據組織。

按場景分類

數據庫還可以按照不同場景進行分類,主要的兩個場景是OLTP和OLAP。OLTP是比較常見的業務系統,比如銀行的交易系統、零售交易系統、企業中的ERP系統、醫療的CASE系統等。這些數據庫系統里面的數據基本上都是OLTP類型的,支持實時交易數據的存儲、更新、共享。

這類系統下,數據不斷發生,不斷更新,可能有很多人在同時去訪問,因此需要的并發也比較高,每次更新都希望反饋的延遲非常低,比如說毫秒級的場景,就是OLTP的場景。

OLAP與我們主要做數據分析和現在的所謂的大數據,也有很多的相似之處,比如BI系統或者說建設數據倉庫,會把很多的歷史數據匯聚過來,然后做一些綜合的分析,希望從中提取一些數據規律,或者做一些數據挖掘。這一類的需求基本上對數據沒有很大頻繁的修改,但是一次要訪問的數據量非常的大,所以不太看重系統的延期,但很看重數據庫的吞吐。這樣的場景其實就是OLAP場景下常見的數據庫。

按架構分類

數據庫也可以按照不同架構進行分類。常見的數據庫是單節點的數據庫,因為單節點可能有一些單點故障的問題。如果有更大的數據量的需求,單節點的數據庫沒有辦法承載,或者需要更大的并發,而此時單點數據庫也沒有辦法承載。這個時候在單節點基礎上就發展了一系列的數據庫集群架構。

 

 

 

數據庫集群架構主要分成三類模式,第一個需要更高的可用性,比如基于組成復制的數據庫集群架構或者基于一致性協議的多活數據庫集群。基于復制的數據庫集群是最常用的多節點數據庫架構,它能夠消除單點故障,同時通過讀寫分離提升性能。基于一致性協議的多活數據庫集群則是無需第三方仲裁,自維護的多活集群架構,它可以在多數派存活條件下可提供服務。

 

 

 

第二個是很多時候在高可用的情況下,遇到面臨單節點的數據庫性能不夠、并發不夠的問題,這個時候就需要橫向擴展技術。最經典的橫向擴展技術就是基于 Shared Disk 的數據庫集群,它是基于Shared Disk的共享存儲,然后上面可能會有多個節點來共同執行數據庫操作的Oracle RAC 的經典架構。它的特點是存儲計算分離,通過高速網絡和分布式存儲替換傳統陣列來提升性能。

 

 

 

但基于Shared Disk的數據庫集群的擴展能力存在限制,難以擴展到百節點以上的超大規模集群,因此就有了基于Share-Nothing的數據庫集群。它的每個節點獨立,具有最強的擴展能力,可擴展至數百甚至數千節點規模。能支持超大規模并發的基于Share-Nothing數據庫集群一般以更高和更不穩定的時延為代價,但是由于和Shared Disk并非完全互斥關系,Share-Nothing集群的每一個節點本身可以是一個Shared Disk 多活集群,從而可以結合兩種架構的優勢。

 

 

 

OLTP 場景下的 Share-Nothing 分布式數據庫雖然數據是分布式存儲和管理的但是單一 SQL 語句的執行大多還是由單一節點執行。相對的,第三類架構就是在OLAP場景下我們需要更大的吞吐時,計算也需要多個節點進行分布式處理,這一架構被稱之為 MPP (Massively Parallel Processing)。

看點三:數據庫發展趨勢

李國良教授的《數據庫發展趨勢》中介紹,新一代的數據庫其實有4個主要的發展方向,一是隨著硬件的發展有更多的新的硬件技術被利用下來;二是隨著數據模型的發展,會支撐更多的數據模型;三是Scalability進一步提升,最后還有Deployment的種類會變得更加的豐富。

 

 

 

針對種類更加豐富的發展趨勢,章博在此介紹了幾個比較廣泛認知的數據庫。一個是現在常見的一個詞叫做HTAP,就是既要有TP的特性,又要有AP的特性。在傳統的架構下,一般通過ETL把TP的數據按照天或者周的周期去導入到一個AP的系統,用兩個不同的系統去承載它,但是傳統架構的時效性不足。當需要實時分析時,HTAP就派上用場了,HTAP通過復制或者在同一個引擎里同時做行列混合存儲,既能支持實時的數據更新,又可以支持比較高的數據吞吐。但是HTAP系統不會用來去直接替代TP系統,一般來說它還是更偏向用于實時分析的補充。

AI也是非常火熱的一個詞,在數據庫領域的話就有兩大的分支,一個是AI4DB,就是如何使用AI技術讓數據庫的可維護性變得更強。另外一個是DB4AI,DB4AI就是如何對AI的數據進行管理,通過一個很完善的數據庫管理系統管理AI的數據,讓 AI的開發和迭代更有效。

最后,這幾年新的硬件技術發展得也非常的快,對整個數據庫系統的優化起著非常大的效果。一個是利用Intel SPDK將NVME SSD性能發揮到極限,另一個是支持RDMA高速網絡。

本期回放鏈接:http://sangfor.bizconf.cn/live/watch/?id=oygey64o

責任編輯:趙立京 來源: 網絡
相關推薦

2021-08-16 13:50:56

大數據深信服

2021-08-16 13:54:23

大數據深信服

2021-09-03 11:46:59

數字化

2011-05-13 13:54:02

數據庫文檔數據庫

2009-01-18 15:36:04

2011-04-18 11:36:43

未來數據庫技術發展

2011-03-17 17:06:38

數據庫發展方向

2020-12-23 07:56:13

數據科學數據工程技術

2010-04-26 10:52:46

Oracle 數據庫

2018-12-11 09:00:24

ERP語言數據庫

2021-10-20 15:56:44

深信服

2022-04-14 12:24:20

大數據現狀分類

2013-12-18 11:48:25

數據庫MySQLSAP

2019-01-16 14:20:42

2009-05-19 11:57:13

memcached分布式緩存MySQL

2009-07-02 00:00:00

OOPOracle

2010-04-23 09:32:39

Oracle數據庫實例

2011-05-19 09:39:51

數據庫計算機

2019-03-05 12:12:39

數據庫HTAPACID
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91亚洲精品国偷拍自产在线观看 | 成人免费网站 | 日韩精品一区二区三区视频播放 | 亚洲国产网站 | 在线观看深夜视频 | 久久99久久99精品免视看婷婷 | 国产乱码精品1区2区3区 | 国产福利91精品 | 成人亚洲性情网站www在线观看 | 黄色在线免费网站 | 伊人网站视频 | 91精品导航| 国产9久| 精品国产18久久久久久二百 | 国产探花在线精品一区二区 | 精品国产乱码久久久久久蜜退臀 | 亚洲精品中文在线 | 日韩淫片免费看 | 欧美一区二区视频 | 日韩成人在线观看 | 中文字幕不卡 | 日韩免费一区二区 | 久久精品欧美一区二区三区不卡 | 久久国产精品偷 | 理论片午午伦夜理片影院 | 国产精品福利一区二区三区 | 伊人天堂网 | 高清成人av | 久久久久久精 | 你懂的国产 | 99亚洲| 欧美成人一区二免费视频软件 | 99精品视频在线 | 国产精品久久久久久久久久免费看 | 中文字幕在线观看一区二区 | 99精品久久久国产一区二区三 | 福利网址 | 国产精品久久 | 在线看片福利 | 大久| 久久激情视频 |