一文看懂人工智能的六個關鍵概念和實施AI項目的七個注意事項
人工智能并不能解決所有問題,但如果應用得當,它可以在短時間內產生很大的變化。
您或許已經聽說過機器學習和人工智能(AI)的前景。這兩個技術概念,已經引起了全世界的關注。自動駕駛汽車、人形機器人、設備預測維護——這些應用不僅僅限于消費者領域,工業界也開始瘋狂了??纯醋罱饕I出版物的諸多頭條新聞就知道了。這種趨勢仍將繼續,實際上,未來它可能無處不在。因此,您不妨了解一下。
AI的興起
傳統上,分析是統計學家的專長。在工業領域普及計算機之前,分析師使用鉛筆和紙完成分析工作。而現在的分析,是描述數據科學的總稱。
例如,沿著一條簡單的線找到一個點,通常屬于標準數據分析的范疇。該線被認為是“回歸”。沿著線找到點是“回歸分析”。執行簡單的回歸分析司空見慣。
機器學習可以看作是AI 的子集,盡管這兩個術語通??梢曰Q使用。機器學習是AI的統計方面,其中還包括認知計算和建模。每個類別的邊界可能是模糊的。
表征AI的另一種方法,是使用真實世界數據得出結論的計算機代碼。如果以此方式建立系統,則可以根據這些結論自動做出決策。然后,可以將更多信息輸入系統并做出更多的決策。對AI 的描述,反映了當今流行文化的對AI 的理解,它反映了人類的思想方式。我們接受信息,得出結論并做出決定。
人類思想常??梢杂?ldquo;如果,那么”的形式來表達,當然也可以用其它形式表示。與此類似,我們也可以用用其中一種算法來實例化AI。根據功能對算法進行分組很有用。我們來了解一下機器學習算法的主要類別。
聚類分析
一些算法將事物進行“分組”。例如,假設正在生產零部件。質保部門或在線測量系統將把兩個測量功能與零件關聯:寬度和高度。將這些數據用于生成圖表。可以使用顏色來明確分類方案。如果您使用的是Excel 向導,則可以自己生成圖形,在新零件通過時將其繪制到圖表上(見圖1)。

圖1 可以使用顏色對零件進行分類,但是如果相關參數太多而無法使用傳統的可視化技術顯示,該怎么辦?本文圖片來源:inductiveAutomation
隨著將更多信息添加到架構中,集群功能變得更強大。假設添加了有關次品的信息。結果顯示,藍色組代表的次品占比將近80%,而綠色組則占大約20%。
但是為什么要停在那里?假設我們也開始收集長度信息。想象一下在三個維度上繪制圖表。先進的繪圖程序可以做到這一點,因此可以繼續手動輸入和分組信息。當分組得到改善后,藍色組顯示的次品占比達到85%。
此時,如果使用機器學習算法完成聚類,它將執行分類,但是只能自動執行可以手動完成的操作。那為什么機器學習是更好的選擇?
更多維度
這個時候,如果需要增加另一個維度怎么辦?也許電導率是有意義的參數,或者是濕度讀數,或者是陽極氧化電流。但是3D 圖只能具有三個維度。另一方面, 使用機器學習算法意味著可以繪制四個、五個、六個甚至一百個維度的圖形。
聚類算法根據每個零件的屬性繪制圖形,將彼此接近的零件識別為一組。一旦完成此操作,就更容易看到哪些屬性或屬性的組合最有可能產生次品。
這意味著可以根據其它屬性自動對分組進行進一步細化,并且可能對藍色組進行充分細化,以預測95%或99%的次品。對于最有可能需要返工的產品,洞察力得到了顯著改善??赡艿倪x擇是在采取不必要的步驟之前,將其從生產環節中撤出,從而可以節省時間和成本。
決策樹
決策樹是另一種在概念上具有重大意義的簡單技術。在數據挖掘中決策樹訓練是一個常用的方法。目標是創建一個模型來預測樣本的目標值。在日常生活中,我們經常會建立決策樹,以回答諸如以下問題:交通狀況如何?天氣如何?我今天應該給媽媽打電話嗎(請參見圖2)?構建一個算法是一項簡單任務。首先,確定描述過程的數據以及有關結果的信息。結果生成的算法,將構建一棵映射預測結果的樹。它會通過多種可能性(也許是數千甚至更多種),來構想出盡可能準確的樹。

圖2 決策樹從簡單元素開始,但可以用來預測高度復雜過程的結果。
模型與訓練
其它重要的分析概念,還包括建模和訓練。當將過程數據輸入到機器學習算法中時,就會進行訓練,從而生成模型,進而識別出好的和壞的過程示例。
想象一下,有人坐下來用筆寫出一個決策樹。然后他們寫了一個又一個決策樹。之后,就可以確定最佳決策樹,然后放棄其它決策樹。最終的決策樹就是模型。對于聚類算法,該模型將僅被稱為“聚類模型”或“模型”。
換句話說,使用最佳決策樹可以利用一組數據基于處理流程來獲得預測?;氐角懊娴氖纠?,第一個語句可能是“如果寬度小于23.5,那么xxx”,第二個語句可能是,“如果高度大于43.3,那么xxx。”機器學習算法創建問題,以獲得它所能得到的最佳答案。
決策樹在預測性維護應用中具有很大的實用性。如前所述,回歸分析可能很簡單。但當涉及到機器學習算法時,它可能會很復雜。
回歸分析
同樣,回歸分析的基礎可以通過在一條線上找到一個點來說明。要畫一條線,首先要確定畫一條什么類型的線。它是曲線嗎?是直線嗎?它有很多曲線嗎?如果將其繪制在x-y 二維平面中,這很容易做到。當將機器學習應用于復雜數據和更多維度時,它會大放異彩。手工繪制100 個維度,永遠是不切實際的,但是一種算法可以輕松地解決這一問題,并且可以輕松找到最佳擬合回歸(如果存在的話)。
回歸分析在過程調整和生產預測中非常有用。并非所有數據都適合進行回歸分析(例如,聚類數據),但是對于那些某個因素會影響其它因素的項目可能非常有用。
深度學習
也許您聽說過深度學習和神經網絡,那您真的了解它們是什么嗎?深度學習是機器學習的分支,是一種以人工神經網絡為架構,對數據進行表征學習的算法。神經網絡是包含數千或數百萬個節點的模型,這些節點是計算機代碼的小塊,每個塊都可以接受輸入并產生輸出。所謂神經網絡是因為它們旨在模擬神經元在大腦中的工作方式。就像我們大腦中的神經元一樣,節點之間的某些連接相對較強,其它可能相對較弱。

圖3 可以將神經網絡設計為大致類似于大腦的工作方式。
對于神經網絡,算法不只是配置節點。它們自我構建,從而可以建立具有數百萬個節點的模型來處理數據。
當神經網絡“消化”數據時,它會變形和變化,直到在預測結果或提供分類方面達到設定目標為止。經過訓練,它可以做幾乎所有事情??赡苄枰@取最近的傳感器讀數并經計算獲得問題出現的可能性?;蛘?,它可以評估一組1 和0,以確定是否描繪了一只貓。所有這些數百萬個節點,都以某種方式“理解”了圖像。對每個節點只是簡單的數學運算,但節點的排列和權重都可以以某種形式用于獲得結論。
這就是為什么很少能有人真正理解它們的原因。要求數據科學家解釋神經網絡,他們可能能夠解釋數學問題。如果請同一位數據科學家解釋如何在這些字節中識別“怪獸”,他可能會用“魔法”來解釋。
神經網絡如此令人印象深刻,它們在工業領域也提出了難題。如果算法告訴您要做某事,您會做嗎?如果是決策樹、回歸分析或聚類模型分配建議,則可以跟蹤獲得結論的方式。但是,神經網絡可能不會讓你了解獲得系統的“原因”。它只是給出一個可以相信與否的答案。如果這些決定可能會導致停機或生產瓶頸,則可能會遭到質疑,為什么要使用算命先生的魔法水晶球來制定決策。
未來就在這里
世界正在變化,人工智能和機器學習技術將不斷發展,并且在更多行業得到應用。人工智能技術已經證明了其價值,采用的企業看到了已經獲得的領先優勢。人工智能并不能解決所有問題,但如果應用得當,它可以在短時間內產生很大的變化。所以放開手腳,大膽的去建立模型吧,你會在過程中找到答案的。
實施AI項目的7個注意事項
如果你正在學習或計劃實施機器學習或人工智能項目,有一些事要優先考慮。
01識別問題
首先選擇要改進的過程、區域或技術。在機器學習或AI 似乎可以提供幫助的地方,找到最需要解決的問題和目標。
02收集數據
數據越多越好。成千上萬的數據點,盡可能多的幫助訓練模型。確保使用高質量的數據。不良數據很容易引發算法失敗。數據預處理和數據清理,是影響成功的關鍵因素。
03整理統計數據
了解采樣技術以及因果關系和相關性。了解結果的質量,有助于避免發生錯誤。
04具有專業知識
了解過程或技術對于了解結果是否合理至關重要。數據科學家很棒,但是僅僅關注某些數據,不會取得好的結果。
05創建模型
這可以與現有的任何機器學習軟件一起使用?,F代的監控和數據采集(SCADA)系統,內置了一些流行的機器學習算法。許多云產品和平臺都將這種類型的算法作為選項。
06部署模型
通常,可以在機器旁邊或內部運行模型,甚至構建在云上或利用其它工具。尋找運行模型的最佳方法。如果是關鍵過程的一部分,則在本地運行是理想選擇。
07監控是否成功
如果無法衡量成功,就沒有人會知道它的存在??梢詫⑾惹暗倪^程數據與最新數據進行比較。如果模型需要改進,請返回到第5 步。請記住,有時嘗試幾種模型或將幾種模型組合會產生更好的結果。