如何選擇合適的物聯(lián)網(wǎng)數(shù)據(jù)庫?
企業(yè)應通過了解其數(shù)據(jù)、功能要求以及數(shù)據(jù)庫如何適應其業(yè)務戰(zhàn)略來開始尋找合適的IoT數(shù)據(jù)庫。
要選擇正確的物聯(lián)網(wǎng)數(shù)據(jù)庫,IT管理員必須首先評估數(shù)據(jù)類型和數(shù)據(jù)流,并定義其功能、性能和其他業(yè)務需求。
最好的物聯(lián)網(wǎng)數(shù)據(jù)庫必須能夠滿足物聯(lián)網(wǎng)特定要求。選擇物聯(lián)網(wǎng)數(shù)據(jù)庫時,IT管理員要考慮很多因素,包括可伸縮性、容錯能力、高可用性和靈活性。他們還必須考慮數(shù)據(jù)庫的位置(本地還是云),以及是否應該對其進行管理。
為了幫助選擇數(shù)據(jù)庫,物聯(lián)網(wǎng)技術人員應采取循序漸進的方法,以確保物聯(lián)網(wǎng)數(shù)據(jù)庫滿足其組織的需求。
如何選擇合適的物聯(lián)網(wǎng)數(shù)據(jù)庫?
1. 評估數(shù)據(jù)庫將存儲和管理的數(shù)據(jù)類型
物聯(lián)網(wǎng)數(shù)據(jù)類型與應用本身一樣多種多樣,但它們可以分為幾類,包括:
- 設備元數(shù)據(jù):這可能包括設備ID,物理設備的唯一標識符;設備類別或類型;設備的生產(chǎn)日期;硬件序列號;和當前配置或版本。該數(shù)據(jù)是相對靜態(tài)的。
- 設備狀態(tài)信息:這包括該設備的各種相關狀態(tài),例如打開或關閉,主動或被動或正在記錄。該數(shù)據(jù)可以是動態(tài)的。
- 遙測數(shù)據(jù):設備收集的數(shù)據(jù)(假設它是傳感器或主要功能是收集數(shù)據(jù)的設備)通常以流數(shù)據(jù)的形式到達,該數(shù)據(jù)會更改每個單位,并可能組織為多個通道。
- 命令數(shù)據(jù):該數(shù)據(jù)控制執(zhí)行器或設備采取動作,例如向左旋轉或加速。
- 運營數(shù)據(jù):有關設備本身操作的數(shù)據(jù),包括CPU使用率,內存使用率或熱量。
許多物聯(lián)網(wǎng)新手都把注意力集中在命令和遙測數(shù)據(jù)上,從而誤導了業(yè)務流程。此重點是以管理數(shù)據(jù)為代價的,管理數(shù)據(jù)包括設備數(shù)據(jù)、狀態(tài)數(shù)據(jù)和操作數(shù)據(jù)。但是,將管理數(shù)據(jù)應用于數(shù)字雙胞胎,物理物聯(lián)網(wǎng)環(huán)境的數(shù)字鏡像或重新創(chuàng)建意外的故障模式或進行取證時,至關重要。
2. 繪制數(shù)據(jù)流
物聯(lián)網(wǎng)領導者必須確定在何處收集、匯總、分析和轉換不同類型的數(shù)據(jù),以及如何將數(shù)據(jù)集成到其他系統(tǒng)中。是否需要豐富數(shù)據(jù),以及在什么時候需要捕獲和記錄數(shù)據(jù)?確保確定數(shù)據(jù)存儲和復制的區(qū)域。會有規(guī)范的數(shù)據(jù)存儲嗎?規(guī)劃在何處,何時何地將數(shù)據(jù)存檔。
3. 繪制數(shù)據(jù)庫需要滿足功能需求
物聯(lián)網(wǎng)技術人員定義了數(shù)據(jù)和數(shù)據(jù)流的類型之后,下一步是將數(shù)據(jù)庫需求映射到功能需求,包括:

- 數(shù)據(jù)提取和聚合:從設備收集和匯總數(shù)據(jù)后,通常會高速處理數(shù)據(jù),尤其是如果遙測和命令數(shù)據(jù)來自高速流時。此類數(shù)據(jù)需要用于遙測的高性能讀取和用于命令數(shù)據(jù)的高性能寫入以及高可靠性和可用性。
- 邊緣分析:許多數(shù)據(jù)流體系結構都包括相對靠近設備本身的邊緣分析。數(shù)據(jù)需求包括數(shù)據(jù)轉換、過濾、充實和任何其他聚合。邊緣分析數(shù)據(jù)庫需要高速讀寫功能和極低的延遲,還需要支持分析工具和解決方案的能力。
- 核心分析:隨著數(shù)據(jù)的進一步聚合(可能在基于云的核心中),它可能需要進行額外的轉換、豐富和分析。核心分析數(shù)據(jù)庫平臺需要高可用性。它還可能需要分發(fā)并支持流分析。
- 管理控制臺需要捕獲和顯示設備數(shù)據(jù),包括元數(shù)據(jù)、操作數(shù)據(jù)和狀態(tài)數(shù)據(jù)。它應包括可視化和儀表板功能,并要求毫秒級的延遲。
- 商業(yè)分析: IoT網(wǎng)絡中的數(shù)據(jù)通常需要集成到更大的數(shù)據(jù)湖中,數(shù)據(jù)科學家可以在其中運行分析和AI。 IoT數(shù)據(jù)庫需要與企業(yè)現(xiàn)有的業(yè)務分析或可靠的數(shù)據(jù)倉庫和分析集成。
4. 根據(jù)功能需求確定數(shù)據(jù)庫性能需求
簡而言之,數(shù)據(jù)庫通常會在性能(讀寫響應時間)和壽命(數(shù)據(jù)必須保留并保持最新狀態(tài)的時間)之間進行權衡。
接收和邊緣分析需要非常低的延遲和高性能,但通常不需要將大量數(shù)據(jù)保留很長時間。相比之下,業(yè)務分析數(shù)據(jù)庫需要將大量數(shù)據(jù)保留數(shù)月、數(shù)年或數(shù)十年,但不需要亞毫秒級的響應時間。這種功能上的差異導致需要多個集成的IoT數(shù)據(jù)庫,而不是單個數(shù)據(jù)庫類型。
5. 應用其他業(yè)務需求
性能不是唯一的要求。其他因素包括提供商如何通過許可費用為服務定價、數(shù)據(jù)庫的位置、組織使用開放源代碼工具和資源的立場以及將與IoT數(shù)據(jù)庫集成的舊環(huán)境等等。