成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

NoSQL還是SQL?這一篇講清楚

開發 開發工具
隨著互聯網快速發展,各種類型的應用層出不窮,所以導致在這個云計算的時代,對技術提出了更多的需求,所以業界推出了多款新類型的數據庫,被統稱為 “NoSQL”系列數據庫。

一、NoSQL的誕生原因

隨著互聯網快速發展,各種類型的應用層出不窮,所以導致在這個云計算的時代,對技術提出了更多的需求,主要體現在下面這四個方面:

1. 低延遲的讀寫速度:應用快速地反應能極大地提升用戶的滿意度;

原因:當數據量達到一定規模時,由于關系型數據庫的系統邏輯非常復雜,使得其非常容易發生死鎖等的并發問題,所以導致其讀寫速度下滑非常嚴重;

2. 支撐海量的數據和流量:對于搜索這樣大型應用而言,需要利用PB級別的數據和能應對百萬級的流量;

原因:有限的支撐容量:現有關系型解決方案還無法支撐Google這樣海量的數據存儲

3. 大規模集群的管理:系統管理員希望分布式應用能更簡單的部署和管理;

原因:由于存在類似Join這樣多表查詢機制,使得數據庫在擴展方面很艱難;

4. 龐大運營成本的考量:IT經理們希望在硬件成本、軟件成本和人力成本能夠有大幅度地降低;

原因:企業級數據庫的License價格很驚人,并且隨著系統的規模,而不斷上升;

業界為了解決上面提到的幾個需求,推出了多款新類型的數據庫,并且由于它們在設計上和傳統的NoSQL數據庫相比有很大的不同,所以被統稱為 “NoSQL”系列數據庫。總的來說,在設計上,它們非常關注對數據高并發地讀寫和對海量數據的存儲等,與關系型數據庫相比,它們在架構和數據模型方量面 做了“減法”,而在擴展和并發等方面做了“加法”。現在主流的NoSQL數據庫有BigTable、HBase、Cassandra、SimpleDB、CouchDB、MongoDB和Redis等。

NoSQL還是SQL

二、為何要使用NoSQL數據庫?

1. NoSQL具有靈活的數據模型,可以處理非結構化/半結構化的大數據

現在,我們可以通過Facebook、D&B等第三方輕松獲得與訪問數據,如個人用戶信息、地理位置數據、社交圖譜、用戶產生的內容、機器日志數 據以及傳感器生成的數據等。對這些數據的使用正在快速改變著通信、購物、廣告、娛樂以及關系管理的特質。沒有使用這些數據的應用很快就會被用戶所遺忘。開 發者希望使用非常靈活的數據庫,能夠輕松容納新的數據類型,并且不會被第三方數據提供商內容結構的變化所累。很多新數據都是非結構化或是半結構化的,因此 開發者還需要能夠高效存儲這種數據的數據庫。但遺憾的是,關系型數據庫所使用的定義嚴格、基于模式的方式是無法快速容納新的數據類型的,對于非結構化或是 半結構化的數據更是無能為力。NoSQL提供的數據模型則能很好地滿足這種需求。很多應用都會從這種非結構化數據模型中獲益,比如說CRM、ERP、 BPM等等,他們可以通過這種靈活性存儲數據而無需修改表或是創建更多的列。這些數據庫也非常適合于創建原型或是快速應用,因為這種靈活性使得新特性的開發變得非常容易。

 2. NoSQL很容易實現可伸縮性(向上擴展與水平擴展)

如果有很多用戶在頻繁且并發地使用你的應用,那么你就需要考慮可伸縮的數據庫技術而非傳統的RDBMS了。對于關系型技術來說,很多應用開發者會發現動態 的可伸縮性是難以實現的,這時就應該考慮切換到NoSQL數據庫上。對于云應用來說,關系型數據庫一開始是普遍的選擇。然而,在使用過程中卻遇到了越來越 多的問題,原因就在于他們是中心化的,向上擴展而非水平擴展的。這使得他們不適合于那些需要簡單且動態可伸縮性的應用。NoSQL數據庫從一開始就是分布 式、水平擴展的,因此非常適合于互聯網應用分布式的特性。

在三層互聯網架構的Web/應用層上,多年來向上擴展已經成為默認的擴展方式了。隨著應用使用人數的激增,我們需要添加更多的服務器,性能則是通過負載均 衡來實現的,這時的代價與用戶數量成線性比例關系。在NoSQL數據庫之前,數據庫層的默認擴展方式就是向上擴展。為了支持更多的并發用戶以及存儲更多的 數據,你需要越來越好的服務器,更好的CPU、更多的內存、更大的磁盤來維護所有表。然而,好的服務器意味著更加復雜、私有、并且也更加昂貴。這與Web/應用層所使用的便宜的硬件形成了鮮明的對比。

3. 動態模式

關系型數據庫需要在添加數據前先定義好模式。比如說,你需要存儲客戶的電話號碼、姓名、地址、城市與州等信息,SQL數據庫需要提前知曉你要存的是什么。 這對于敏捷開發模式來說是場災難,因為每次完成新特性時,數據庫的模式通常都需要改變。因此,如果在開發過程中想將客戶喜歡的條目加到數據庫中,那就得向 表中添加這一列才行,然后要做的就是將整個數據庫遷移到新的模式上。

4. 自動分片

由于是結構化的,關系型數據庫通常會垂直擴展,單臺服務器要持有整個數據庫來確保可靠性與數據的持續可用性。這樣做的代價就是非常昂貴、擴展受到限制,并 且數據庫基礎設施會成為失敗點。這個問題的解決方案就是水平擴展,添加服務器而不是為單臺服務器增加更多的能力。NoSQL數據庫通常都支持自動分片,這 意味著他們本質上就會自動在多臺服務器上分發數據,應用甚至都不知道這些事情。數據與查詢負載會自動在多臺服務器上做到平衡,當某臺服務器當機時,它能快 速且透明地被替換掉。

5. 復制

大多數NoSQL數據庫也支持自動復制,這意味著你可以獲得高可用性與災備恢復功能。從開發者的角度來看,存儲環境本質上是虛擬化的。

三、NoSQL優缺點

在優勢方面,主要體現在下面這三點:

  • 簡單的擴展:典型例子是Cassandra,由于其架構是類似于經典的P2P,所以能通過輕松地添加新的節點來擴展這個集群;
  • 快速的讀寫:主要例子有Redis,由于其邏輯簡單,而且純內存操作,使得其性能非常出色,單節點每秒可以處理超過10萬次讀寫操作;
  • 低廉的成本:這是大多數分布式數據庫共有的特點,因為主要都是開源軟件,沒有昂貴的License成本;

但瑕不掩瑜,NoSQL數據庫還存在著很多的不足,常見主要有下面這幾個:

  • 不提供對SQL的支持:如果不支持SQL這樣的工業標準,將會對用戶產生一定的學習和應用遷移成本;
  • 支持的特性不夠豐富:現有產品所提供的功能都比較有限,大多數NoSQL數據庫都不支持事務,也不像MS SQL Server和Oracle那樣能提供各種附加功能,比如BI和報表等;
  • 現有產品的不夠成熟:大多數產品都還處于初創期,和關系型數據庫幾十年的完善不可同日而語;

上面NoSQL產品的優缺點都是些比較共通的,在實際情況下,每個產品都會根據自己所遵從的數據模型和CAP理念而有所不同。

四、適合場景

NoSQL數據庫正在成為數據庫領域的重要力量。如果使用恰當,那么它會帶來很多好處。然而,企業應該非常小心并注意到這些數據庫的限制與問題。

NoSQL這兩年越來越熱,尤其是大型互聯網公司非常熱衷這門技術。根據筆者的經驗,并不是任何場景,NoSQL都要優于關系型數據庫。下面我們來具體聊聊,什么時候使用NoSQL比較給力:

1. 數據庫表schema經常變化

比如在線商城,維護產品的屬性經常要增加字段,這就意味著ORMapping層的代碼和配置要改,如果該表的數據量過百萬,新增字段會帶來額外開銷(重建索引等)。NoSQL應用在這種場景,可以極大提升DB的可伸縮性,開發人員可以將更多的精力放在業務層。

2. 數據庫表字段是復雜數據類型

對于復雜數據類型,比如SQL Sever提供了可擴展性的支持,像xml類型的字段。很多用過的同學應該知道,該字段不管是查詢還是更改,效率非常一般。主要原因是是DB層對xml字 段很難建高效索引,應用層又要做從字符流到dom的解析轉換。NoSQL以json方式存儲,提供了原生態的支持,在效率方便遠遠高于傳統關系型數據庫。

3. 高并發數據庫請求

此類應用常見于web2.0的網站,很多應用對于數據一致性要求很低,而關系型數據庫的事務以及大表join反而成了”性能殺手”。在高并發情況 下,sql與no-sql的性能對比由于環境和角度不同一直是存在爭議的,并不是說在任何場景,no-sql總是會比sql快。有篇article和大家 分享下,http://artur.ejsmont.org/blog/content/insert-performance-comparison-of-nosql-vs-sql-servers

4. 海量數據的分布式存儲

海量數據的存儲如果選用大型商用數據,如Oracle,那么整個解決方案的成本是非常高的,要花很多錢在軟硬件上。NoSQL分布式存儲,可以部署在廉價的硬件上,是一個性價比非常高的解決方案。Mongo的auto-sharding已經運用到了生產環境。http://www.mongodb.org/display/DOCS/Sharding

并不是說NoSQL可以解決一切問題,像ERP系統、BI系統,在大部分情況還是推薦使用傳統關系型數據庫。主要的原因是此類系統的業務模型復雜,使用NoSQL將導致系統的維護成本增加。

五、選擇SQL還是NoSQL

上面說明了為什么要使用NoSQL。接下來我們看下如何把NoSQL引入到我們的項目中,我們到底要不要把NoSQL引入到項目中。

在過去,我們只需要學習和使用一種數據庫技術,就能做幾乎所有的數據庫應用開發。因為成熟穩定的關系數據庫產品并不是很多,而供你選擇的免費版本就 更加少了,所以互聯網領域基本上都選擇了免費的MySQL數據庫。在高速發展的WEB2.0時代,我們發現關系數據庫在性能、擴展性、數據的快速備份和恢 復、滿足需求的易用性上并不總是能很好的滿足我們的需要,我們越來越趨向于根據業務場景選擇合適的數據庫,以及進行多種數據庫的融合運用。幾年前的一篇文 章《One Size Fits All - An Idea Whose Time Has Come and Gone》就已經闡述了這個觀點。

當我們在討論是否要使用NoSQL的時候,你還需要理解NoSQL也是分很多種類的,在NoSQL百花齊放的今天,NoSQL的正確選擇比選擇關系數據庫還具有挑戰性。雖然NoSQL的使用很簡單,但是選擇卻是個麻煩事,這也正是很多人在觀望的一個原因。

六、NoSQL的分類

NoSQL僅僅是一個概念,NoSQL數據庫根據數據的存儲模型和特點分為很多種類。

NoSQL數據庫根據數據的存儲模型和特點分為很多種類

以上NoSQL數據庫類型的劃分并不是絕對,只是從存儲模型上來進行的大體劃分。它們之間沒有絕對的分界,也有交差的情況,比如Tokyo Cabinet / Tyrant的Table類型存儲,就可以理解為是文檔型存儲,Berkeley DB XML數據庫是基于Berkeley DB之上開發的。

七、選擇和使用建議

雖然09年出現了比較激進的文章《關系數據庫已死》,但是我們心里都清楚,關系數據庫其實還活得好好的,你還不能不用關系數據庫。但是也說明了一個事實,關系數據庫在處理WEB2.0數據的時候,的確已經出現了瓶頸。

那么我們到底是用NoSQL還是關系數據庫呢?我想我們沒有必要來進行一個絕對的回答。我們需要根據我們的應用場景來決定我們到底用什么。

如果關系數據庫在你的應用場景中,完全能夠很好的工作,而你又是非常善于使用和維護關系數據庫的,那么我覺得你完全沒有必要遷移到NoSQL上面, 除非你是個喜歡折騰的人。如果你是在金融,電信等以數據為王的關鍵領域,目前使用的是Oracle數據庫來提供高可靠性的,除非遇到特別大的瓶頸,不然也 別貿然嘗試NoSQL。

然而,在WEB2.0的網站中,關系數據庫大部分都出現了瓶頸。在磁盤IO、數據庫可擴展上都花費了開發人員相當多的精力來優化,比如做分表分庫 (database sharding)、主從復制、異構復制等等,然而,這些工作需要的技術能力越來越高,也越來越具有挑戰性。如果你正在經歷這些場合,那么我覺得你應該嘗 試一下NoSQL了。

1. 選擇合適的NoSQL

如此多類型的NoSQL,而每種類型的NoSQL又有很多,到底選擇什么類型的NoSQL來作為我們的存儲呢?這并不是一個很好回答的問題,影響我們選擇 的因素有很多,而選擇也可能有多種,隨著業務場景,需求的變更可能選擇又會變化。我們常常需要根據如下情況考慮:

  • 數據結構特點。包括結構化、半結構化、字段是否可能變更、是否有大文本字段、數據字段是否可能變化。
  • 寫入特點。包括insert比例、update比例、是否經常更新數據的某一個小字段、原子更新需求。
  • 查詢特點。包括查詢的條件、查詢熱點的范圍。比如用戶信息的查詢,可能就是隨機的,而新聞的查詢就是按照時間,越新的越頻繁。

2. NoSQL和關系數據庫結合

其實NoSQL數據庫僅僅是關系數據庫在某些方面(性能,擴展)的一個彌補,單從功能上講,NoSQL的幾乎所有的功能,在關系數據庫上都能夠滿足,所以選擇NoSQL的原因并不在功能上。

所以,我們一般會把NoSQL和關系數據庫進行結合使用,各取所長,需要使用關系特性的時候我們使用關系數據庫,需要使用NoSQL特性的時候我們使用NoSQL數據庫,各得其所。

舉個簡單的例子吧,比如用戶評論的存儲,評論大概有主鍵id、評論的對象aid、評論內容content、用戶uid等字段。我們能確定的是評論內 容content肯定不會在數據庫中用where content=’’查詢,評論內容也是一個大文本字段。那么我們可以把 主鍵id、評論對象aid、用戶id存儲在數據庫,評論內容存儲在NoSQL,這樣數據庫就節省了存儲content占用的磁盤空間,從而節省大量IO, 對content也更容易做Cache。

  1. //從MySQL中查詢出評論主鍵id列表 commentIds=DB.query(“SELECT id FROM comments where aid=’評論對象id’ LIMIT 0,20”); //根據主鍵id列表,從NoSQL取回評論實體數據 CommentsList=NoSQL.get(commentIds);NoSQL代替MySQL  

在某些應用場合,比如一些配置的關系鍵值映射存儲、用戶名和密碼的存儲、Session會話存儲等等,用NoSQL完全可以替代MySQL存儲。不但具有更高的性能,而且開發也更加方便。

3. NoSQL作為緩存服務器

MySQL+Memcached的架構中,我們處處都要精心設計我們的緩存,包括過期時間的設計、緩存的實時性設計、緩存內存大小評估、緩存命中率等等。

NoSQL數據庫一般都具有非常高的性能,在大多數場景下面,你不必再考慮在代碼層為NoSQL構建一層Memcached緩存。NoSQL數據本身在Cache上已經做了相當多的優化工作。

Memcached這類內存緩存服務器緩存的數據大小受限于內存大小,如果用NoSQL來代替Memcached來緩存數據庫的話,就可以不再受限于內存大小。雖然可能有少量的磁盤IO讀寫,可能比Memcached慢一點,但是完全可以用來緩存數據庫的查詢操作。

【本文為51CTO專欄作者“大數據和云計算”的原創稿件,轉載請通過微信公眾號獲取聯系和授權】

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2018-08-13 09:20:21

NoSQLSQL數據

2021-04-21 10:00:08

MySQL索引數據庫

2019-01-31 09:20:36

架構容錯架構分布式容錯

2019-11-25 08:25:47

ZooKeeper分布式系統負載均衡

2021-10-29 11:30:31

補碼二進制反碼

2020-07-29 09:21:34

Docker集群部署隔離環境

2021-07-05 22:22:24

協議MQTT

2017-11-17 08:39:40

人工智能機器學習深度學習

2018-05-21 07:08:18

行為驅動開發BDD編碼

2019-07-07 08:18:10

MySQL索引數據庫

2022-01-05 09:27:24

讀擴散寫擴散feed

2024-01-05 07:55:39

Linux虛擬內存

2024-04-01 10:09:23

AutowiredSpring容器

2019-06-20 17:49:51

RPCHTTP協議

2020-03-09 17:28:51

NoSQLMongoDB數據庫

2021-07-07 10:28:09

分布式架構系統

2025-05-14 01:55:00

FCMCPAI

2020-12-24 15:18:27

大數據數據分析

2021-08-05 06:54:05

Go切片數據

2024-02-22 12:20:23

Linux零拷貝技術
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩国产一区二区三区 | 久久在线 | av黄色在线 | 天天操天天射综合 | 在线 丝袜 欧美 日韩 制服 | 国产精品久久一区二区三区 | 婷婷久久综合 | 欧美成人免费在线视频 | 五月婷婷亚洲 | 狠狠操狠狠操 | 亚洲视频在线看 | 影音先锋亚洲资源 | 亚洲精品免费在线观看 | 精品国产欧美 | 久久精品久久久久久 | 91精品久久久久久久久久入口 | 国产成人高清在线观看 | 欧美v在线观看 | 日韩国产中文字幕 | 91精品国产91久久久久久 | 一区二区三区在线 | 欧美激情网站 | 国产一区二区三区在线看 | 亚洲成人中文字幕 | 91精品久久久 | 91九色视频| 久久99精品国产自在现线小黄鸭 | 91在线电影| 色播久久 | 亚洲一区 中文字幕 | 久久爱综合 | 黄色福利 | 日韩一区二区三区在线观看 | www.久久99| 亚洲精品区 | 久久久久国产一区二区三区 | 激情欧美一区二区三区 | 国产在线h | 欧美色性| 国产综合精品一区二区三区 | 久久这里只有精品首页 |