機器學習解決工業4.0的易變性、不確定性、復雜性和模糊性問題
前言
科技的突飛猛進使工業4.0時代即將到來,然而現實發展仍存在許多風險因素。本文首先分析了工業4.0時代的易變性、不確定性、復雜性和模糊性問題。這四個風險因素源于寶潔公司提出的VUCA戰略,這里的VUCA是它們的英文首字母,該戰略被廣泛用于行業分析之中,目的是根據預期目標提出解決風險的措施。利用機器學習,是解決工業4.0時代的VUCA問題的最佳途徑。
工業4.0時代到來
工業4.0最初在2011年由德國提出,是指為促進工業制造數字化而制定的高科技項目戰略,從而打造完全自動化的制造行業。目前,工業4.0已經應用了最先進的科學技術:云計算、物聯網、大數據、射頻識別、協同開發等。其中以物聯網技術和大數據技術最為知名。
(1)物聯網技術與工業4.0
物聯網(Internet of Things,簡稱IoT)最初由美國麻省理工學院工業自動識別中心的創始人凱文阿什頓在1999年提出,指將一切通過高度智能化的交互系統連接,從而形成自動化的世界。這里的“智能”指利用先進的通信和互聯網技術,有效處理信息,并形成“智能產業”。物聯網設備之間的交互動作,讓它們彼此獲得信息,使得設備自身可以監控業務流程、提高生產效率,進而節省成本,做出更好地決策。
物聯網技術可以被分為四個階段:
- 數據傳感階段:工業生成的數據通過傳感器感測,并收集傳輸到最近的基站等待處理;
- 整理加工階段:對數據進行整理和處理,并根據需要進行相應轉換;
- 預處理階段:利用邊緣技術處理系統在數據傳輸到中心前進行預處理;
- 存儲維護階段:生成的數據被存儲維護,為后續分析建立基礎;
物聯網技術(Internet of Things)
物聯網技術的四個階段說明,具有高度感測技術的自動化裝置是工業物聯網的基礎組成部分,這些智能機器的操作將增加工業生產的靈活性,影響生產者對智能管理的依賴性,并為行業發展設定新的標準。
物聯網技術能滿足數字市場的快速發展和消費者需求的不斷增加,在不需要人工干預的情況下,及時、準確地完成分配的工作。使用物聯網的行業運營效率更高,更能了解客戶的需求,最終提高盈利能力。
(2)大數據與工業4.0
工業發展導致系統中出現了巨大的數據流,這些數據的保護、處理和維護成為人們關注的焦點,大數據技術(Big Data Technology,簡稱BDT)由此而生。大數據最初由IBM數據科學家定義而來,從字面上講,意味著大量信息的數據集合,它是一個分析海量數據的概念。
大數據這個概念有五個維度:
- 體量:大數據代表數據數量上遠比之前龐大;
- 多樣:不同的數據源,生成了不同結構的數據;
- 速度:數據生成的速度快,分析處理的速度也快;
- 真實:數據的真實性是分析的前提;
- 價值:通過分析數據得到的行動是有價值的;
大數據技術(Big Data)
目前,大數據已經成為各種業務數字化的基礎,它在收集、傳輸、分析和使用大量實時數據的同時,生成的信息提供了智能流程的改進思路,從而保障工業生產高效、無故障地執行。適當收集和分析大數據將提高產品制造、供應鏈管理、物流和風險管理等多個部門的競爭力。
VUCA戰略知多少
VUCA戰略指的是前言中提到的易變性、不確定性、復雜性和模糊性,最初的VUCA戰略發源于軍事領域,但是現在已經廣泛應用于商業分析中。VUCA戰略通過分析預期的發展風險因素,并對這些情況加以準備,從而在競爭激烈的商業世界中生存。因為VUCA發音近似于烏卡,所以也用“烏卡”代表。
VUCA戰略具有如下四個維度:
- 易變性(Volatility):指商業環境中的極端和快速變化。這些變化的速度、數量和幅度可以反映它在商業環境中的波動程度。產生易變性的原因往往是已知的,比如價格的易變性會導致供應鏈的風險,商品供給的易變性將導致公司無法滿足消費者需求;
- 不確定性(Uncertainty):由于易變性的存在,在缺乏了解的時候將會產生不確定性,從而導致未來不可預測,影響長期發展。在商業環境中,可能引起不確定性的因素包括:用戶需求、偏好的變化,新政策的提出,新產品對舊產品的替代等;
- 復雜性(Complexity):復雜性的產生來自兩個方面,一是工業化的快速發展,使企業內部相互聯系的網絡和程序逐漸復雜,二是外部的商業環境的不確定性導致決策的復雜性。外包活動(如會計核算、市場營銷和計算機輔助設計業務)的引入,導致復雜性更加普遍;
- 模糊性(Ambiguity):模糊性表現在商業行動中無法清晰陳述、無法準確評估概率以及無法描述潛在結果的多樣性,當新產品或者新計劃被引入市場時,模糊性出現的可能性更高;
機器學習知多少
機器學習屬于數據科學范疇,被視為一種涵蓋數據處理所有方面的研究,它是人工智能的一個分支,賦予機器自主學習的能力,而不需要人工干預。機器學習使計算機不需要人工編程,就可以自動化地執行任務。

機器學習技術(Machine Learning)
機器學習的流程如下:
1.數據收集:這是機器學習流程的第一步,也是最重要的一步。計算機根據問題陳述收集相關數據,這些被收集的數據被稱為訓練數據,它們應當準確完整,以便解決問題;
2.數據預處理:預處理是為了將采集到的不完整、不一致和錯誤的數據轉換為可行的數據,以便更好地擬合機器學習模型。在除去了數據集的問題后,數據的特征將被提取出來,并用于模型訓練;
3.模型構建:選擇適當的機器學習技術來獲得預期結果的過程。機器學習的模型種類很多,總體可分為有監督學習、無監督學習和強化學習三種,不同的技術適合處理的問題不同;
4.模型訓練與測試:在確定選擇哪種模型之后,預處理的數據集會被分為訓練集和測試集兩個部分,分別滿足訓練和測試兩種要求。模型訓練指利用機器學習技術將模型評估的誤差降到最小,當模型訓練完成后,它就被用于測試數據集中進行測試工作,以評估模型的效率和準確性,測試的結果會由一些評價指標進行反映;
5.性能評估:利用交叉驗證、參數調整和多種機器學習算法,嘗試得到效果更好的算法,或者使用組合方法將多個算法的結果組合起來;
6.模型執行:執行模型輸出結果,以便在未來利用模型完成機器學習任務;
那么,機器學習是如何對VUCA戰略進行解讀的呢?由于不同的VUCA戰略所要實現的目標不同,這就涉及到了一些具體的機器學習算法。
機器學習讓計算機擁有智能
機器學習解讀VUCA戰略
在這一部分中,作者會介紹幾種常用的機器學習算法,簡要描述它們的原理,并舉例說明它們在工業4.0的VUCA戰略的現實應用。
(1)線性回歸模型:線性回歸是回歸算法中一種有監督的機器學習算法,它根據給定的變量來預測結果,得到兩者的線性關系。常用的線性回歸模型有兩種,分別是單個變量的簡單線性和多變量的多元線性回歸。
線性回歸模型主要解決VUCA戰略的易變性和不確定性問題。谷歌公司的應用軟件已經利用線性模型分析特定道路的歷史數據,來預測交通狀況。一些金融從業人員利用波動率指標建立線性模型來預測金融市場的波動性,并證明該方法優于傳統的移動平均法。
(2)Logistic回歸模型:是分類算法中一種有監督的機器學習算法,以給定的變量作為輸入值,以0或1、是或否、真或假等離散值預測輸出結果。雖然是回歸模型,但解決的是分類問題,通過給出預測得數據所屬類的概率來完成判別。
Logistic回歸模型主要解決VUCA戰略的復雜性和模糊性問題。醫療行業用這個方法將病人分為關鍵診斷和非關鍵診斷類別,金融行業據此建立預警模型,根據過去的債務、違約情況和收入,判斷用戶是否會在業務中違約。這種算法有效地處理了復雜和模糊的風險因素,預測結果具有較高的精度。
(3)決策樹模型:一種有監督的機器學習算法,分為分類算法和回歸算法兩類。數據集被分為具有相同類別的較小部分,直到所有的數據都被分類,且節點是最終的決策節點。決策樹由熵、信息增益來構成,以預測事件的不確定性程度。
決策樹模型主要解決VUCA戰略中的不確定性和模糊性問題。例如,大型工業項目由于規劃設計復雜,且參與的群體多樣,存在很大的不確定性,利用決策樹模型可以對這些不確定因素進行分類,提前預測風險。
(4)隨機森林模型:一種有監督的機器學習算法,通過隨機收集決策樹來預測期望的結果,從而創造“森林”,隨著決策樹生長,每個決策樹都可以對新對象分類并投票,最高票數將對隨機森林的過程分類。
隨機森林模型主要解決VUCA戰略中的模糊性問題。它有助于估計公司不穩定的業務績效指標,如預測機械零件故障的可能性、估算市場的盈利能力并最小化風險,在預測災害損失方面也有應用,且效果優于其他機器學習算法。
(5)支持向量機模型:分類算法范疇下的有監督機器學習算法,通過生成一個平面或者決策邊界將樣本分成不同的類,數據樣本點根據不同的特征進行分類,每個點都有不同的坐標作為支持向量。
支持向量機模型主要處理易變性、復雜性和不確定性問題。供應鏈管理系統的需求預測、工業材料風險對沖模型等都涉及到了這些內容。
機器學習多種技術模擬決策
總結
工業4.0通過物聯網和大數據技術實現自動化數據交換,通過云計算實現數據存儲和處理,通過認知計算幫助人類決策。它降低了人力成本,簡化了業務流程,提高了生產預測的準確性。這些改進將顯著提高生產效率和收入,有助于經濟增長。
然而,工業4.0的進程中仍存在易變性、不確定性、復雜性和模糊性問題,這些問題影響了工業發展進程,需要得到合理的解決。機器學習技術可以讓智能設備在不需要人工編程的情況下做出決定,從而減少不確定因素導致的風險,在未來將被廣泛應用。