物聯網增長太快了嗎?
很快,地球上生成數據的設備將是人類的七倍,而且這個數字還在繼續增長。調查公司Juniper Research的***統計數據顯示,到2022年,物聯網傳感器和設備的預計數量將從目前微不足道的210億臺增長到500多億臺,增幅為140%。
該研究的作者預測,邊緣計算服務將成為這一增長的主要原因。研究發現,由于帶寬需求的減少、應用程序響應速度加快以及數據安全性的提高,以及邊緣計算的興起對于擴大部署至關重要。Juniper Research預測,在2023年連接的460億臺工業和企業設備中,很大一部分將依賴邊緣計算。
所有這些設備和連接的挑戰是數據——并弄清楚如何將其集成到企業系統中,以及如何為企業帶來價值。許多企業已經從一開始就在與傳統基礎設施相關聯的關系數據庫管理系統上構建了他們的信息技術,而這些基礎設施并沒有被設計或配備來吸收或管理物聯網正在提供的大量連續數據流。許多高管認為,他們可以很容易接入物聯網,并開始獲得回報。然而,要做到這一點,還需要做很多工作。
最近的一篇文章中,國際應用系統分析研究所(IIASA)***分析官 Bill Franks證實了這一點。也就是說,物聯網數據看起來比實際情況更簡單。Bill Franks說 :“大多數傳感器以簡單的格式輸出數據——有時間戳、測量標識符(溫度、壓力等),然后是一個值。因此,你可以非常快速地從原始Feed轉到準備好進行探索的數據集或表格”。
但是,企業的重要價值在哪里?它可能不在無休止的時間戳數據流中,而是在彈出的異常中。哪些異常是相關連的,哪些只是異常?正在傳輸的特定來源數據是否是機器使用和性能的精確指標?所有這些問題必須事先進行檢查。Bill Franks提醒道:“不要讓數據攝入的簡單性欺騙了你”。
將會發生的事情是,企業將被無用的數據淹沒和不堪重負——需要吞吐量、處理和某種存儲,以及處理這些流程的專業知識。對于物聯網數據,有必要確定實際對你的具體問題有意義的節奏,例如,溫度傳感器可以每毫秒讀出一次讀數,然而,在大多數情況下,以這種節奏接收數據有點多余了。由于存儲額外數據的成本以及分析大量無用數據的成本和復雜性,這種過度消耗是有代價的。
一些關鍵考慮
為了充分利用物聯網,Bill Franks建議考慮以下因素:
- 設置適當的節奏:確定什么節奏對你正在解決的問題有價值。如果你正在監控汽車發動機,那么每秒讀數可能就足夠了,或許可能每5、10或60秒讀取一次就足夠了。關鍵是你必須評估每一個指標,并通過一些實驗確定你需要什么。然后,將數據過濾到適當的級別,否則,你將會被數據淹沒,而有意義的模式將難以識別。
- 隨著時間推移識別復雜的模式:在分析物聯網數據時,我們通常對偏離正常值感興趣,而不是預測預期值。在識別出什么是正常的之后,我們必須努力尋找重要的異常模式,然而,異常模式可能有多種演變方式。氣溫突然升高自然會引起人們的興趣,但是,如果溫度上升很小,或者持續很長一段時間,或者隨著頻率的增加而上升,會產生什么影響呢?識別這些基于時間的模式存在很多復雜性。
- 弄清楚如何處理交互:讓我們假設你已經為你關心的每個指標確定了適當的節奏,以及對于每一個指標來說哪些模式是重要的。那么你又如何解釋任何互動?問題在于,影響可能會有滯后,例如,溫度可能會在壓力上升之前就開始上升。為了確定各種傳感器讀數之間的相互作用,不僅需要進行復雜的分析,以確定哪些指標可能會相互作用,還要確定在什么時間范圍內以及何時滯后。
- 解釋錯誤和遺漏的讀數:傳感器并不總是可靠的,任何分析過程都必須建立制衡機制,以解決丟失的數據或出錯的數據。你的分析流程必須包含識別可疑錯誤或傳輸差距的邏輯,并處理這些情況。
最重要的是,隨著物聯網生成數據量的增加,決策者需要坐下來構建系統和流程,以獲得對其業務最重要的洞察力。這需要了解什么對企業來說很重要,以及什么是物聯網數據或沒有告訴我們。