如何選擇高性能NoSQL數據庫
很多公司會選擇“NoSQL”或“Not Only SQL”新型數據庫來支撐在線和運營程序服務,那么我們要如何選擇高性能NoSQL數據庫?
1. 為數據庫定義目標
NoSQL數據庫的目標可能是為移動設備上的數千名用戶提供個性化數字體驗,為后端支付處理應用程序存儲數據,管理有一定時間生活的短暫數據,或將持久數據存儲為系統記錄。你甚至可以在特定方案的同一數據管道中涉及多種類型的數據庫。
無論用例如何,在數據管道中定義NoSQL數據庫的特定功能非常重要,包括如何收集,提取和提供數據以進行分析。
2. 確定吞吐量和延遲要求
通常,這需要你的應用程序的響應時間<100毫秒。否則,它將被視為緩慢,你可能會失去用戶的興趣。但是,一些應用程序 - 例如游戲,通信和金融交易系統 - 要求其數據庫的響應時間低至13毫秒。
除延遲外,我們還需要確定吞吐量要求。例如,數據庫可以處理數千個同步數據流,延遲低至50毫秒或更長?
了解將對數據庫提出的要求對于確保用戶體驗的質量非常重要。
3. 為正確的作業選擇正確的數據庫
通常,開發人員選擇NoSQL數據庫是因為它們需要半結構化或非結構化數據,具有靈活的模式,簡單的查詢模式,高速事務,大量數據以及通過分布式計算和存儲的快速且廉價的可擴展性。你可以通過CAP定理進一步縮小選擇范圍,CAP定義定義如下:
一致性:每次讀取都會收到最近的寫入或錯誤。
可用性:每個請求都會收到(非錯誤)響應 - 不保證它包含最近的寫入。
分區容差:盡管節點之間的網絡丟棄(或延遲)任意數量的消息,系統仍繼續運行。
根據CAP定理,你可以優先考慮CA,AP或CP特征。這有助于確定哪個數據庫最適合你的應用程序。
4. 選擇托管服務提供商和自己動手(DIY)
托管服務解決方案使用經驗豐富的資源處理數據庫的日常管理。這使你自己的資源能夠專注于應用程序所需的創新和效率。如果朝這個方向發展,請評估提供數據庫即服務選項的第三方選項,并選擇能夠在保證正常運行時間的同時處理吞吐量和延遲要求的提供商。
當然,外包可能并不總是可選的,在這種情況下,應該考慮哪些數據庫提供商提供的軟件版本支持大規模配置,調度和管理容器。請務必檢查你最期望的功能,例如可伸縮性,主動 - 主動部署,吞吐量和延遲 - 并在概念驗證試驗期間對其進行驗證。
5. 確定部署模式
理想情況下,你需要一個數據庫提供程序,它允許在選擇的任何環境(無論是公共還是私有)中運行數據庫,并完全控制你的數據和配置。數據庫軟件也應該作為Docker鏡像提供,這將允許企業開發人員在基于Docker的微服務架構中使用它。
如果使用私有平臺即服務(PaaS),請確保你的數據庫提供商支持私有PaaS環境中的無縫擴展和輕松高可用性。
如果選擇托管服務提供商,請確認它們支持跨多云提供商的群集部署。