成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

甘穎濤:工業大數據和人工智能技術在智能制造領域的應用|V課堂第45期

企業動態
11月10日,江蘇省企業信息化協會總群迎來第45期“智造+V課堂”。本期“智造+V課堂“邀請了北京水木聯合科技有限公司總經理甘穎濤為大家帶來主題為《工業大數據和人工智能技術在智能制造領域的運用》的精彩分享。

11月10日,江蘇省企業信息化協會總群迎來第45期“智造+V課堂”。本期“智造+V課堂“邀請了北京水木聯合科技有限公司總經理甘穎濤為大家帶來主題為《工業大數據和人工智能技術在智能制造領域的運用》的精彩分享。

一、嘉賓簡介

[[180020]]

甘穎濤(北京水木聯合科技有限公司總經理)

個人簡介:

1、現任北京水木聯合科技有限公司總經理;

2、曾在IBM、中國惠普、EMC等國際知名IT公司任職;

3、北京大學光華管理學院MBA;

4、北京工業大學自動控制專業學士學位;

公司簡介:

水木聯合公司是國內領先的工業互聯網領域人工智能解決方案提供商,用自主研發的大數據分析平臺和算法模型為轉型發展中的制造業企業提供預測性質量管理、安全風險預警、設備預測性維護、精準營銷一體化等解決方案。

二、主題

演講主題

《工業大數據和人工智能技術在智能制造領域的應用》

演講大綱

1)工業大數據的概念、特點和戰略思考

2)工業大數據商業價值實現路徑

3)抓住人工智能的浪潮,實現制造業轉型

4)解決方案和案例分享

三、原文實錄

原文實錄:

江蘇省企業信息化協會總群的領導和朋友們大家晚上好。非常難得有這個機會能夠在群里跟大家匯報一下我們工作,大家有問題我們可以熱情的討論,那接下來我就大概一個小時左右的時間,跟大家匯報一下我們在工業大數據,和人工智能技術研究和應用方面的工作,以及我們在智能制造領域的一些體會心得、和實踐經驗。大數據這個詞前一段非常火爆,大家可能經常看中央電視臺,也聽到主持人經常提到這個,根據大數據分析非常熱鬧,但是大數據往往是跟消費互聯網是緊密結合的,所以國內目前有數十家專注做大數據的公司,也主要是針對電商,輿情數據,社交平臺的數據進行數據的采集和處理,真正把大數據技術應用在工業領域進行業務分析的并不多,我們是比較先進的一家,比較領先的一家,我們一直專注于用統計數學分析的方法和技術,幫助客戶理解和應用工業大數據!

其實,最近工業大數據分析的應用也很受到投資圈的追捧,大概在去年下半年,今年的上半年和年終,大概陸續有幾家都得到了大概幾千萬到上億元的這個融資,所以說明這個市場在快速蓬勃的發展,什么是工業大數據?我想先把工業大數據的概念跟大家分享一下,工業大數據的概念首先來自于2012年美國通用電器,GE公司發布的工業互聯網突破機器與智慧的界限研究報告,報告中指出工業大數據是在工業領域相關自動化和信息化應用中產生的海量數據!其實我們理解具體來講,工業大數據包括比如說設備數據、傳感器數據、儀器儀表數據等持續數據,也包括了涵概設備設施的時序數據,地理信息坐標的時空數據,還有運營系統中的訂單質量檢測數據以及第三方的天氣環境數據等。也就是說它包括了企業內和上下游的產業鏈,還包括外部來自市場、用戶和環境的數據等,提法也基本可以明確我們所說的工業大數據和工信部、江蘇省經信委提倡的兩化融合在數據層面的理解是統一的。從目前來看,我國制造業企業對工業大數據的采集、挖掘和利用,還處于早期階段,應用水平的差別很大。

美國工業大數據分析的應用

但是我們看一看美國的情況,麥肯錫在2012年的一份大數據報告中指出,在虛擬經濟占主導地位的美國,其工業界蘊含的數據總量反而是巨大的,大家可以看一看這張圖,美國離散制造業他存儲數據的總量已經達到了966個TB,位于美國各個行業的***位。相反美國政府以848個TB居于第三位,第三位是通訊和媒體,第四位也是制造業是流程制造業,數據總量達到了694個PB,我們原來認為數據使用保有量***的銀行業只排在了第五位。

這個調查結果說明工業數據的主體也就是由機器設備所產生的數據量,遠遠超過其他行業,以人為主產生的數據,正是因為有了這樣巨大數據基礎,以美國GE公司為主的制造業巨頭,提出了工業互聯網的概念,而工業互聯網的三大要素分別是智能聯網的機器,人與機器協同工作,以及先進的數據分析能力,目前全世界最成功的工業大數據分析和實用應用的實力是GE公司的Predix云平臺,它在高度安全的工業集云環境中捕捉和分析海量高速運行,類型多樣各種機器產生的數據,Predix 2014年他的全年收入是40億美元,2015年是在60億美元,2016年應該還是有一個很快的增長。工業數據大數據的價值巨大,結合到國內的制造業企業,工業大數據具體有什么用?其實大家還是有不少困惑的,所以我想在詳細介紹工業大數據的概念,戰略,特點等等之前呢,先跟大家分享一個案例,給大家一些直觀的印象,這些工業大數據能怎么用?這個項目的客戶呢是一個國內的一家大型的鋼鐵企業,他們在生產自動化企業信息化方面已經做了很多年的投入,SCADA系統,MES系統,EMS系統,他們都已經建立了,也就是說基本上達到了已經達到了我們兩化融合一個基本要求的標準。因此數據基礎比較好,但是客戶為什么找到我們來做這么一個項目呢?其實,客戶這個鋼廠有一個厚板部,在厚板生產和銷售中一直有一個問題困擾他們,就是厚板的應力殘留問題,厚板生產出來他們的客戶主要是造船廠,船廠對厚板的品種度要求非常高。一旦發現交貨交過來的厚板呢,如果里邊有殘留應力引起變形,船廠就拒絕是無法使用的,他就會要求鋼廠退貨,或者降低產品的質量等級進行折價銷售。也是就說鋼鐵行業中的這叫質量損失,為了減少質量損失呢,這家鋼鐵企業在完整的厚板生產工序后邊又加了一道冷矯工序,也就是在厚板經過傳統的加熱爐、粗軋、精軋、冷卻后,又增加了一道新的工序,用冷矯機對厚板進行殘留應力的釋放。

企業希望通過這種冷矯,釋放在加熱和軋制過程中,積攢在厚板中的內應力,但是,其實大家得知道這個冷矯不是必需的,它費時費力,而且影響交貨時間,給企業增加了成本,本來現在鋼鐵企業經濟效益就很差,利潤就很低。如果再加上這道工序,基本上可能就從賺錢變成虧錢了。而且,在實際運用中,哪些板子要上冷矯機,也完全憑生產人員的經驗判斷。其實只要生產過程中控制的好,是可以避免使用冷矯這道工序的,因此,客戶給我們提了一個要求,讓我們來解題。 這個題目中客戶希望我們結合厚板的生產信息,和內應力變形的這個客戶投訴的問題信息,建立厚板這個應力殘留與否的預測模型。從而減少客戶的投訴,并以此預測的結果為依據,決定厚板成品是否要進行冷矯,取代原來完全憑經驗、憑人工判斷的這個這種情況!我們首先判斷呢根據企業的生產經驗這個題是可以解的,熟悉鋼鐵生產領域專家都知道,任何內應力其實你都是很難做到完全釋放的,只不過是釋放的大小和快慢的問題,那么這個區別就決定于生產過程是如何生產的?

所以,生產信息和殘留應力引起的質量問題投訴之間一定有相關性,接下來呢我們看了一下客戶提供給我們進行建模數據的情況,客戶提供給我們大概他們最近4個月,沒有做冷矯的1800條子板的生產信息,和質量投訴信息,這1800條是沒有上冷矯機的,在這1800條子板中呢,后來我們知道被客戶發生質量問題損益的有23條,客戶提供給我們的生產信息呢包括板配的加熱信息,扎制的道次,熱矯冷卻信息,厚板質量檢測信息等100多個信息。其實這些信息拿來數據的情況并不樂觀,我們在做這個項目的時候,其實有兩個挑戰,首先***個是如何處理不均衡性?不均衡的問題,對于1800條子板中出現質量的只有23條,我們一般把出現質量問題的叫正樣本,這個正副樣本的非常不平衡,需要在分析過程中生成填充數據來平衡樣本。

第二是如何處理變量的強相關性?每個子板它經過了多道的熱加工粗扎、精扎工序,每道工序之間它從工藝上很多是強相關的。那你怎么能夠判斷出哪些變量是直接影響了他的這個內應力的問題?所以,要解決獨立這些變量中的相關性問題,必須用合理的算法辨識影響分析結果的獨立變量,在對業務要求和數據有了初步理解后,我們開始按照我們的大數據挖掘計量模型方法論對數據進行分析處理。首先我們把這1800條沒有經過冷矯的子板數據進行拆分,其中70%用來做我們的模型訓練,另外30%用來做模型驗證。用來驗證的這個30%的子板數據,我們要求客戶結果先對我們保密,等我們模型建成后,再將我們模型預測的結果與實際情況進行比較驗證,我們對客戶提供的原始數據進行了清洗、加工、填充空缺值,設置默認值。同時由于有問題的厚板過少,正樣本過少,我們也采取了一些數學的方法處理。

我們也在過程中跟客戶的業務專家溝通,去理解數據,建立數據的表征特征,建立分類模型,在這個項目中我們采取了隨機森林、邏輯回歸、拉鎖算法這幾個分類模型,并且把分析100次的隨機模型進行模式的比較和評價,最終確定了用來預測的模型。

如何處理變量的強相關性

***當我們把這模型固定下來以后呢,用剩下的30%子板的數據拿出來驗證,我們把這30%子板每條板生產信息作為輸入數據進入模型,然后經過計算給出明確的預測結果,判斷這條子板會不會因為有應力風險引起質量問題投訴,最終我們的模型效果還是很不錯的,大家可以看看下面這張圖。從這張圖大家可以看,驗證子集一共是537條子板,我們通過我們的模型跑出來,我們預測沒有質量風險的是521條,實際證明也全部正確,也就意味著這521條子板根本不需要上冷矯工序,我們預測有9條子板有質量風險,應該上冷矯機。事實證明其中6條最終因為沒有做冷矯,而發生了質量投訴。

我們預測沒有風險,但卻最終發生了質量投訴的子板只有一條。從模型的評價曲線來看,我們可以看AOC就是叫曲線下面積這個指標,我們達到了0.9729,其實一個模型大概在0.8以上也是算是不錯的,我們做到0.97這個結果還是很令人滿意的,也就意味著如果客戶,也就意味著這個鋼鐵企業客戶最終在他的生產中,運用我們這個模型,根本不用憑經驗。像原來一樣把40%的厚板成品全都上冷矯機,只需要經過我們這個把他們生產信息,這個厚板生產過程中信息倒過來,經過我的模型算出來,預測模型判斷出哪些會出現質量問題的風險的子板,加一道冷矯工序就可以了,就可以大大規避質量損益的發生,可以節省大量的成本,也節約了交貨的時間。

變量重要性示意圖

同時,我們還給出了與殘留應力質量投訴相關的所有重要性的獨立變量,并將這些重要性進行了排序,那就意味著客戶,下面這張圖可以看出來,也就意味著客戶今后通過對這些變量進行合理控制,就會降低殘留應力帶來的質量投訴量。我剛才是跟大家分享了我們做一個實際的案例,其實就是數據分析是不是能夠幫到工業企業,對這些工業大數據分析它的價值?又使用到它的價值。

所以工業大數據其實是有巨大的挖掘利用前景,因此我認為工業大數據對每個企業來說,在戰略層面上都要充分重視,但是戰略層面的考慮,其實經過我們這一段時間的實踐,我想跟大家分享有三個方面需要考慮。首先***點,就是目標必須明確,業務充分參與,從戰略層面上企業建設工業大數據平臺必須業務目標明確,必須有業務部門的充分參與,咱們群里我知道是有很多企業的CIO,我認為大家認識到這一點更為重要,在我的職業生涯中呢,其實我跟很多的企業的CIO做過交流,有咱們制造業企業的,也有銀行運營商的電信運營商的CIO,大家共同的一個認識這么多年,就是一個優秀的CIO其實是整個IT部門和業務部門的橋梁。這個橋梁至關重要,對于工業大數據平臺項目的上馬,企業的CIO更需要戰略視野和協調能力,工業大數據項目對企業來說它不是一個簡單的信息化建設,也不是一個業務部門能提出復雜明確的需求,然后依托一個集成商作為一個交鑰匙的項目,企業的工業大數據通常與企業智能化轉型、制造轉型的大戰略是密切相關的。

其實大家看看GE就可以知道,GE這些年他在工業大數據在智能化、數字化、互聯網化轉型方面,做了巨大的投入,很多產品在設計的時候就已經在考慮傳感器和互聯網化的設計,而這么大的投入,貫穿全生命周期的投入,必須是在董事會和CEO的層面的決心和支持下才可以實施的。其實大家前一段可以看到,關于GE有很多新聞,有一條就GE他賣掉了他賺錢的集中服務部門,但是,他卻堅持在產品智能化和服務化方面進行投資,在工業大數據的分析和應用的領域方面進行投資,這種戰略眼光是非常有前瞻性的。

所以,從Predix成功也可以看到,執行的效果也非常好。包括我前一段看到對GE的CEO有個采訪,他也談到了:這個決心對GE是下了很大的決心的,因為整個的投入其實也是很大。但是他們從目前來講他們的轉型他感覺是很成功的,其實在國內大家也可以看到,在我們身邊隨著一帶一路政策的推出,像江蘇的徐工集團,像三一重工,他們這些先進的裝備制造商也開始紛紛推出自己的智能裝備的產品。并且,開發基于自己產品的工業大數據、云服務平臺,進行數字化、服務化轉型,提供主動性的、預測性的設備維護,這也是在公司整體戰略下、指引下實施的。所以,這是我談的***點,目標必須明確,業務充分參與。

下面我談談工業大數據項目的戰略第二點,企事也很重要,就談到架構整體考慮應用小步快跑,這一點其實我認為也是傳統企業在實施互聯網加的這個戰略中的一個通用的戰略。也就是利用互聯網先進的技術體系和快速迭代的應用方式,來實現大工業大數據平臺的建設。很多CIO跟我講,他覺得很多工業大數據平臺,動不動投資都很大,規劃也很大,但是企業或董事會過項目的時候大家問,到底有什么效益?有什么效果?這樣雞生蛋,蛋生雞的問題其實讓CIO也很難辦。

那我覺得其實具體來講,整個企業的工業大數據的平臺的建設要分兩層考慮,***層是大數據的平臺架構,平臺架構設計上確實要充分考慮工業大數據的特點,那么接下來我待會會詳細講進工業大數據的特點是哪些?采用這種開源的技術整體設計,第二點就是在設計整體考慮的時候,平臺之上的大數據應用更要關注的是如何快速的將數據價值變現,其實大家從我剛才講的鋼鐵企業實力可以看出來,其實在一個企業里邊,需要用數據分析來解決的問題,只要你去找有很多、很多。我們是不是一定要在解決實際問題,一定要想一個大的問題呢?不用,其實把很多具體業務問題都可以用數據來解決,這就是我談的大數據平臺搭建好以后,設計好以后,我們要看怎么能夠快速將數據價值變現,這一點至關重要,然后就需要選擇有業務價值業務場景,想明白一個做一個,不要圖大,小步快跑,迅速見效產生效果,讓業務部門讓決策層真正看到企業所擁有數據的價值。這是我講的第二點就是工業大數據的應用不要圖大,不要圖高端,要從解決業務的實際問題入手,而且不斷的快速迭代,小步快跑。

第三點,我想談的就是這個第三點的戰略要考慮的一點,就是要數據盡早收集,人才系統培養,工業大數據系統,大數據要盡早收集,即便今天的大數據平臺還沒有建好,也非常有必要把生產過程中的各種各樣的數據存回來,而且全面了、全十以無損的形式存儲起來。2015年GE公司將其***一批發動機的診斷數據,從30年前舊系統遷移到了現在的Predix數據平臺,也就是說在目前大約有35000臺發動機會將起飛、巡航的關鍵飛行階段數據包括傳到Predix平臺,其實這些數據它的價值,它就像這些有價值的數據就像河流一樣,流動的河一樣,如果你沒有加以保留,這些數據就會悄然的溜走,它無法形成有價值的數據資產,目前的技術其實已經給我們提供了很多的選擇,即便暫時沒有架構,沒有平臺,也完全有辦法把數據留下來,而不讓數據流失。

我們是因為專業從事這個領域工作的,我們特別深有很深的體會,數據是一切的基礎,沒有數據再先進的軟件平臺和算法都沒有用武之地,這些數據就像待開發的礦產資源,它現在只是它現在埋在地下你不知道怎么挖掘它價值罷了,在這之前先把這地圈下來,先把數據保留下來,如果要開發工業大數據的價值,企業還有一點在企業戰略上要考慮的,一定是要進行人才的培養,其實如果我們現在去看歐美企業的人才構成,我們會發現每個企業都有大量的數據分析員,數據分析師,數據科學家。其實這些人才你看歐洲和美國的企業,這些人才不僅僅是在谷歌、Facebook這樣的互聯網公司,在傳統的制造業企業、物流公司、醫藥公司里都大有人在,我記得上次我跟南鋼的一位領導在交流的時候,領導專門提到南鋼以后要有自己的專業數據分析人才,目前現在南鋼的研發團隊,主要是以鋼鐵工藝專業為主。領導認為這種研發團隊肯定是不夠的,一定要引入大量的統計數學分析人才,從數據角度發現問題、解決問題,讓這些數學專家和鋼鐵工藝的專家結合在一起,來解決生產運營中的問題。

從國內來看大數據分析人才的系統培養,其實也剛剛開始,所以我正好利用這機會跟大家大概分享一下,在這塊人才培養一個現狀,據我了解清華和北大以前主要是在研究生和博士生的培養計劃,培養方向上面,來培養大數據的分析人才,而且基本上是從應用數學專業衍生的數據分析專項。但是在最近兩三年,清華北大已經開始建立了大數據分析本科專業,上周我們還在跟北京郵電大學的老師們交流,北京郵電大學今年也成立了大數據中心,從今年9月份的新一批學生入學開始招收大數據分析的本科生,而且,教委和學校還給了一個很好的政策。讓北京郵電大學設立了一個3+1+3培養計劃,也就是大數據分析的專業的學生本科念三年,研究生念一年,博士念三年,本碩博連讀,之后得到大數據一個分析博士的一個培養計劃,我們今年也在與大學合作,正在向人保部申請設立數據分析師一個技術能力認證體系,開展相關的在職培訓。由此可以看出,大數據分析應用人才的培養,是企業戰略轉型一個重要支點,剛才我大概結合我的工作實踐的理解,對工業大數據的概念,工業大數據項目實施的一些戰略思考,提了一點我的意見,那下面內容可能比較技術一點,我想主要談一談工業大數據的特點,其實工業大數據它之所以叫大數據,那從大數據的思維就是我們說的4V來看,它全都具備,它的數據規模大,處理速度快,數據來源和樣式多樣化,數據價值密度低,特點非常明顯。

工業大數據和商業大數據比較

但是為什么我們專門要今天來談工業大數據呢?其實,工業大數據和消費互聯網上的商業大數據的應用的特點還是有很大不同,下面我簡單的介紹一下,這是兩者的研究對象不同,其實大家都知道工業領域是以物理系統為中心的,我們研究的對象是材料、工藝、設備、能源、環境等因素,研究物理動態過程中的規律和因果關系。商業大數據主要是研究人,研究人在互聯網上的行為,研究人的流程。理解他的行為模式,那這兩者其實有一些是有相融合趨勢的,比如說我們現在都熟悉的消費電子品,消費電子產品,還有我們比如說了解一些智能家居產品,那么用戶在使用的時候,整個大數據的運用貫穿產品的設計研發生產銷售和服務,整個全生命周期,兩者開始融合,但是對復雜的工業,比較復雜的工業,比如說裝備制造,比如說我們非常熟悉的基礎工業,兩者的差別是非常明顯的。

其次兩者的基礎不同,在工業領域其實首先大家熟悉的是不同行業存在的這種大量的中觀和微觀基理模型,所謂基理模型就是以工藝原理為基礎,是人們經過多年對生產過程的深入研究,經過大量的在實驗室的實驗,逐漸形成對模型的認識。客觀來講這種機理模型的這種優化和突破難度也很大,那工業數據中體現出的規律呢,其實也常常難以突破現有生產技術人員的認識范圍,所以才需要通過大數據分析的手段,讓大家去找到數據中的價值。但與之相比商業領域中,其實僅僅存在一些宏觀的理念,它可以定性描述人的一些行為偏好,經濟活動規律。

通過一些統計趨勢的一些大數理論,就可以給他大數據分析帶來提升的空間。第三點就是兩者這種技術帶來驅動力不同,其實現在工業大數據,它受感知技術受我們了解的物聯網技術的發展,包括我們國家現在提出的5G通信網絡技術的發展,對它都是很大的促進。但商業大數據更多的是互聯網的發展,它為企業帶來與客戶交互的一些新渠道,所以互聯網的發展極大的促進了商業大數據的發展。那么工業大數據其實它大多具有的是一些,具有時空信息的結構化數據,這也它跟商業大數據區別很大,商業大數據在互聯網上很多的是一些非結構化的文本、視頻,那么所以這也是兩者在驅動力上的不同,***兩者對分析技術要求也不一樣,其實從這一點大家可以看到,對商業大數據來講,大數原理、大數原則,一些相關性法則,概率性的分析,其實就已經可以幫助客戶做很多有針對性的這種運營的提高。

但是對工業來講還不夠,對分析結果要求精度非常高,動態性很強,實質性高,很難接受一些概率性的預測,就好比我剛才給大家講的這個例子,我如果要預測一個厚板的會不會有殘留應力,產生這種質量的風險?我必須要模型算出來就要告訴客戶有,還是沒有,我不能只給他一個概率。那么,這也是兩者一個很大的區別,大概講了講工業大數據和商業大數據的區別,那其實稱作工業大數據,那我們在分析的過程中其實我們也經常遇到數據,工業大數據里邊一直有一個小與大的矛盾,那這里我大概跟大家也分享一下,我想這也是我們在工作中的一個獨特的體會,其實工業大數據剛才我們談了大致它一個首要的特征,這一點大家都很理解,因為動不動一個工廠的數據采集點,就可以幾千個,甚至到幾萬,幾十萬個,幾百萬個不止長期不停的不間斷的工作,在化工行業采集頻率有的可能到毫秒級,所以數據量非常、非常大。

這些數據的如果要對歷史數據進行全量分析,那么你知道,其實我們都知道企業的這種制造業企業的,產品壽命周期是比較長的,這些設備的折舊周期也比較長的,這樣長時間高頻采集的機器數據量是非常巨大的。可以達到數百TB到PB的存儲量,所以,另外其實大數據里邊還來自于比如說我們還要再分析的時候,還要集成來自ERP這種新系統的關系性數據,設計研發時候產品圖紙、工藝文檔、加工代碼這些非結構化數據,甚至于我們在做比如說產品的全生命周期的分析的時候,還要去結合一些產品銷售在互聯網上的一些口碑,非結構化數據,半結構化數據這些,所以確實工業大數據一個特征。但是他在分析時候我們經常感到,工業數據的不夠用,那我想舉出下面幾點,以后大家在實踐中的時候可以作為參考。

***點,就是對分析有直接意義的樣本比例通常很小。工業的運行其實是有一個常態模式的,其實工業運行的目的是希望是一個不期望干擾因素有很多,他希望他的質量穩定,希望工業這種自動化生產比較穩定,所以它對不期望干擾因素會進行很多的壓制,造成絕大部分數據,其實都是在對應非常相似的這種環境與過程。但是你知道我們在做分析的時候,就像我們剛才談的鋼鐵企業的例子,客戶總是讓我們希望找到有沒有故障?有沒有不良率?有沒有異常行為?這就我剛才談到的其實從數據分析的層面來看,這種樣本是非常少的,有的是大量的常量和穩態數據,也就造成了樣本不平衡性不平衡程度非常高。其實,而且在工業體系還有一點不同,就是他實驗成本有的會蠻高,能做的實驗其實在做機理模型的時候很多都做到了,但是如果我們專門針對一些故障分析,質量的不良,來做試驗的話呢,其實它的實施成本和風險都蠻高的,所以我們在做分析的時候,我們常常會發現工業大數據,即使數據量很多,也很難提供給我們足夠的異常的情形樣本,這是***點。

第二點,就是談到大數據它永遠是物理世界的小樣本。其實我們現在已經采集了很多數據,我們在很多工廠已經實施了自動化改造,有的先進的工廠實施了MES,我們已經采集了大量的數據,但是其實這里邊一直有一個備論,備論就是說我們如果采集的數據越多越好,那我模型用來生成訓練模型這個基礎也越來越扎實,但是如果沒有模型沒有分析的結果,沒有數據價值的體現,實施安裝大量的傳感器,做大量的智能化改造,其實對企業是一個巨大的成本,而這個成本其實企業很難在投入的時候衡量出它到底帶來多大的效果。

那所以這里邊就是我們說的,我們經常遇到在實際的項目中,企業是采了很多數據,但這個數據也很難反映企業的一個全面的生產現狀,比如說現場采集的生產檢測數據,僅僅覆蓋了很小的參數綜合空間,并不是所有關鍵因素都有測量,而且測量值也不一定反映了參數系統的全部。在這個時候我們也有我們的辦法,這個時候其實大家群里的朋友們,其實以后在實施工業大數據項目分析的時候,也可以參考我們這個經驗,這個時候我們提出我們要利用行業專家的先進知識,縮小搜索空間、縮小搜索范圍,所以行業專家我們其實談到的就是業務專家、工藝專家,他們有很多他們的經驗,包括一些有經驗的操作工人,他們對一些的問題有他的一個憑經驗的判斷,但是這些判斷是沒有數據支撐的。但是他如果給了我們這些判斷,其實對我們來講就可以幫助我們來縮小搜索空間,尋取***代表的樣本及進行模擬訓練,發現其中的問題,那***也可能我們的分析結果驗證了他們的經驗判斷,也可能推翻了他們的經驗判斷,但我想這些都是對企業一個很好的收獲。

第三點就是談到數據的這種價值分布,數據價值密度分布非常不均衡。就像剛才我談的,其實我們采集上很多數,在工業系統里面有大量的常量數據、大量的穩態數據,所以我們要在這樣大量數據數據中去找到它一些差異變化量,但是在工業數據中還有很多基礎信息,比如說這些基礎信息我們談到的比如說圖紙,生產指標,工藝要求,操作規程,這些基礎信息可能保留在企業的一些慣性數據庫里邊,這些基礎信息可能數據量本身不大,但它的數據價值非常高。那么我們在做大數據分析模型樣本的時候,我們在建分析的寬表的時候,怎么把這些基礎信息和這種價值密度低的信息做匹配,這也是一個挑戰!

剛才大概講了三點,就是我談到工業大數據,大家老說很大,但在小和大之間其實是有一個矛盾統一的,那么正是因為這個工業大數據有這些特點,那我們想我們在往下做的時候,工業大數據對工業領域的支持,對企業的幫助,它應用渠道有哪些?

我想主要可能有三點,***個,三個渠道,***個渠道就是工業大數據能夠幫助我們,把生產過程中的物理過程、和我們的業務運營的過程融合,其實有些MES系統,也能達到這樣的效果。MES系統,但是MES系統更關注在企業的生產流程,更關注的是把企業的流程的這種規范統一,那我們在數據分析上就完全不受生產流程的限制,我可以拿來各種數據放在一起來比對分析,只要在模型建立的時候,但是我們建立模型時候其實要考慮將物理量,和經營過程量,比如這里邊的說產品質量、生產效率、設備可靠性關系量化。

第二,就是其實我們談到數據分析關注的應該是知識的自動化,而不是知識的發現。其實我們采集了大量的數據以后,我們要將業務領域的知識進行系統,通過大數據分析進行檢索和更新優化,對于相對明確的專家知識,比如說我們說的熟練工人的經驗,工藝專家的經驗,借助大數據建模工具提供的這種時空模式描述,識別技術,進行這種形式化的建模。就是以后用這種模型,在數據中進行持續的掃描和報警,把工人和專家的經驗模型化,實現這種知識領域的自動化。

第三,就是軟測量。在工業應用中其實我們知道,很多測量不同過程量檢測的技術可行性,精度,頻度,成本差別都特別大。就像我們在做質量檢測時候也發現,其實如果我所有的產品都做全檢成本是很高的,實際當我們有了一些數據情況下,我們其實可以通過大數據分析,建立我們不好測量的這些物理量,和好測量物理量之間的一些關聯關系模型,通過容易測的過程量去推斷難測的過程量,提升生產過程的整體的可觀可控。

以上我就跟大家簡單的介紹了一下我們在通過這一段時間的工作,對工業大數據的概念、戰略,它的數據特點一些理解,那下面我談另外一個話題,就是工業大數據的商業價值實現的路徑。大數據其實是制造業實現從要素驅動向創新驅動轉型一個有利手段,其實我們國家最近一直在談供給冊改革,說明從宏觀形式上我們要改變國家這種投資拉動,出口拉動的一個需求冊驅動的經濟模式,轉向供給冊結構調整驅動模式,我想大家在聽經信委的領導,聽協會的領導在跟大家介紹的時候都講過很多,那我們其實也是跟也是有親身的體會跟客戶在做溝通的時候,我們對制造業而言,在宏觀需求皮軟的大環境下,如何通供給端的創新實現轉型至關重要。其實,說句嚴重點的話,現在的創新轉型,可能無法保證這個企業像以前一樣活的有滋有味,但是可以保證企業在經濟下行的環境中活下來。

工業大數據的商業價值實現的路徑

為什么我們江蘇一直在推動兩化融合,推動智能工廠,智能車間的改造,都是這個目的。作為企業的CEO,CIO,我們更要清醒的認識,兩化融合是手段,目的是要推動企業創新,保證企業活下來活的好。那么我認為通過利用工業大數據企業可以在四個層面進行創新,大家可以看看這張圖,最下面一層其實是業務模式創新,具體來講其實就是要很多企業要基于互聯網的特點,開發出適用于互聯網的產品,智能產品,打破傳統營銷市場中的一些時空限制,開發智能聯網新產品,衍生新的智能服務。

其實我們可以看到比如說像格力,現在他們空調可以聯網,比如像小米他的PM2.5的設備也可以聯網,比如我們看像普惠發動機,像GE、像三一重工,他們的設備本身交到客戶的時候,就具備了聯網的功能。包括我們比如看到特斯拉,它是一個汽車呢,還是一個大的電腦呢?還是一個大的蓄電池呢?其實大家從各個角度都可以評價它,現在很多互聯網技術的發展,讓很多的產品本身有了很多新的定義,智能產品聯網產品的研發,對企業來講是最直接的,而且也是我認為是目前來講創新需求***最廣泛一個領域。

工業大數據的商業價值在這個層面我覺得可以體現在,營銷一體化,精準營銷,設備的在線健康檢測,主動預警維護這些服務模型中。上面一層是生產模式的創新,這一層也是我們熟悉的智能工廠、智能車間所涉及的方面,通過數控機床、工業機器人的使用, MES、能管系統的建設,建立這種生產過程的工業數據、設備在線數據監測這樣的一些改造。那在這個過程中其實大數據的應用我是覺得一定要和行業的先沿知識緊密結合,各個行業都會涌現出本行業的大數據應用創新的代表企業。

剛才跟大家介紹的鋼鐵企業的殘留應力、質量投訴,殘留應力引起變形質量投訴這種預警模型的,可以說是在這個層面的一個大數據體系應用,再往上一層是這種運營模式創新,這一層其實很多企業已經開展了很多信息化建設,它與企業的運營流程的創新是緊密相關的。在原有企業原有的ERP系統,CRM系統,物流系統,PRM系統的基礎上,實現數據的全打通,提升企業整體運營效率,實現精益管理。

這一層以我的觀點來看,其實有很多是以傳統的BI的應用為主,因為客戶是從運營的流程的優化,運營的角度來看,大數據的價值體現,我認為主要體現在兩個方面,***個是以經營系統的問題為核心,引入剛才下一層的生產設備工化和運行作為補充的分析數據員,入這些分析,設備策展、設備工礦和運行數據的這種補充的這種分析數據員,突破以前的這種精益管理、精益生產的這種,只關注管理流程的局限。

第二,引入外部大數據。我們比如說就是企業采用中包中治的手段,進行產品研發,突破企業原來過于關注企業內部生產要素局限,那我想在這一層其實也有很多企業做出了,在工業大數據中做了很多新的一些嘗試。最上一層是這種決策模式的創新,其實決策模式在德國工業4.0的十大挑戰和機遇中,他特別強調整個公司轉型,必須成為CEO工作每一部分,整合的數據使用與分析,是工業互聯網一個核心能力。依靠數據進行決策應該成為企業的常態,依靠數據進行決策不應該僅僅停留在戰略層面的決策,也包括每個具體工作、具體事物方面的決策,未來的高速運轉的企業呢,將會為每一個關鍵決策,都會定義一個數據分析模型,依據模型結果為決策提供支撐,甚至是可以做出自動的決策。所以實現決策創新的關鍵,我認為是在決策層面,引入積極學習和人工智能技術,推動決策效果和效率的提升,實現三維價值。

我剛才大概介紹了一下我對這種商業價值實現路徑的,工業大數據創業價值實現路徑一個理解,接下來我想談談我今天演講題目中另外一個話題,下一個話題叫:抓住人工智能的浪潮實現制造業轉型,那這里指的主要的我認為是在工業決策創新領域人工智能技術的運用,談到的這人工智能技術,可能并不涉及人工智能應用的其他領域,因為,人工智能是很廣的,其他領域比如說大家熟悉的一些機器視覺、人臉識別、語音識別,這些仿生學技術的領域今天可能我不太涉及,如果大家看過凱文凱利的《失控》那本書,一定會記得其中有一個例子,這個例子給我的印象是非常深刻的,今天在這里跟大家也分享一下,書中寫在2002年,那個時候凱文凱利參加了谷歌一個小型聚會,那是谷歌還沒有IPO,還在一心一意的做網絡搜索。凱文凱利和谷歌的創始人拉里.佩奇隨意聊了起來,當時凱文凱利問佩奇說,前面有雅虎搜索,硅谷還有很多搜索公司,谷歌為什么你們還要做免費的搜索呀?

其實當時看到這一點的時候我的想法我相信跟很多人一樣,其實這個問題我當時給出了答案,我自己想那這是谷歌的業務模式,它***免費搜索來聚集人氣,然后通過什么DSP,這些廣告拍賣的方式獲取收益。AlphaGo是一個典型的人工智能應用,有人認為它的運作方式是靠記下人類歷史上的全部的棋譜定勢,其實這理解不對的AlphaGo它不是這樣做的,它首先經過長期復雜訓練,訓練來自于人機對決和自我對決,有大量的數據對他進行訓練。然后采用深度神經網絡和蒙特卡洛樹的搜索數算法,不斷提高人工智能計算能力,而且在實戰中,它更是把實際下每一步棋都作為輸入條件,進入它的模型算法中繼續進行迭代。

評估整體盤面的優略,并計算圍棋盤上每一個位置落子概率,最終確定落子在哪個位置?***有上百臺服務器在云端為AlphaGo提供計算資源,AlphaGo也僅能計算出未來的三步棋,其實把AlphaGo的訓練和應用模式應用到工業領域中,是非常有實際意義的。我有時來個對比,我也不知道是不是恰當,但是我是這么理解的,就拿AlphaGo,原來我們以為人機對戰就像我們很多現在手機上的下棋游戲的這個算法一樣,其實它就是被棋蠱被定勢,這種方式放在工業上,好比就理解是工業領域的機理模型的方式。也就是基于工藝的限制,通過試驗各種可能性,根據實際生產的特定條件來求出自由解,這種方法其實跟剛才我說的被定勢的方法一樣的,但是目前我們給企業推薦工業大數據應用,是要用數據分析模型的方法,就是用工業生產中實際產生的生產運營中的大量數據,結合各種聚類分類算法,訓練企業自有的人工智能系統。最近在智能制造領域,其實聽的最多就是工業機器人,工業機器人確實可以幫助企業實現人類成本大幅降低,所以很多企業我看跟很多制造業企業聊天,他們特別認可在工業機器人領域的投資,因為可以替代人嘛,現在人工成本增長太快,那么他們在這個領域投資,遠遠超過企業對工業大數據平臺和分析模型投資的愿望。

其實我認為這是一個誤區,目前的工業機器人更多是在仿生學進行突破,目前的機器人還遠沒有人工智能,而且我認為不經過長時間的數據訓練也不會實現人類智能。開句玩笑話,現在機器人的人工智能思維能力,也許還介于猩猩和人之間,這種工業機器人我認為仍然只能被認為是一種智能設備,像數字機床一樣。在相當長的時間內人都是不可替代的,人機的高效交互協作,應該是未來智能工廠的典型場景,而且我覺得也應該不是未來了,應該很快的出現在各位的企業里邊,工廠里邊,只不過傳統的工作場景都是由工人,有經驗的操作工人,憑借經驗、憑借工藝單,去操縱一個一個獨立的設備,但是,一個智能工廠里邊的具有人工智能一個智能工廠工作場景,應該是人和設備,成為智能工廠里面平等的二元,他兩是平等的。人和設備都要接受后臺的人工智能系統給出的決策和控制指令,進行高度協作。

所以,企業應該認識到,建設人工智能系統是整個企業進行決策創新的重要戰略。具體實施上我們還是建議采用架構整體設計,大膽小步快走的方法,針對每一個問題實現局部,首先實現局部的人工智能,最終積少成多,構建強壯穩定的人工智能系統,使數字化企業有一個強大的大腦,這很像人類從小長大學習知識逐漸成長過程。局部的人工智能技術的開發,我們認為必須要經過數據采集、數據建模、機器學習、多次反復迭代,最終實現人工智能這樣一個過程。

所以,我認為在人工智能在智能制造領域的實現,應該以工業大數據的理解和應用為主線。我相信可能群里邊有些朋友,對我這個看法可能會不完全同意,有自己的看法,但是我這是我自己的理解,我認為應該以工業大數據的理解和應用為主線,我國制造業企業在這方面的人才儲備,數據儲備,模型儲備,投資規模都還處于起步的階段。首先我們企業的業務人員,工業專家不了解數據分析的方法算法,他們對數據的使用還停留在報表階段、可試化階段。

第二,缺少專業的數據分析人才。缺少專業的數據分析人才,而工業大數據如果不經過科學的數據挖掘計量實施方法處理,你是很難看到其中的價值。

第三,缺少與行業業務結合緊密的數據分析模型資源庫。現在大家談大數據談的都是Hadoop,Spark這些IT技術,說模型算法說的都是各種回歸,各種決策數據算法,其實企業不知道這些技術如何與企業的業務結合,解決實際問題。這是為了解決上述人工智能技術,在智能制造領域實際應用的難題,我們在這個領域進行了專注的產品研發,那我想也快9點了,我再花幾分鐘時間吧,簡單介紹一下我們公司的,我們的公司產品和解決方案。

[[180021]]

我們公司的名字叫北京水木聯合科技有限公司,英文是TangMIX,“Tang”我們起唐朝的唐,有中國特色,而且我們的產品也都是全都自主研發的,我們目前有幾個核心產品,一個是我們專門為工業大數據優化的一個大數據分析平臺,叫“數笈云”,我們給大家發一下我們界面,“數笈云”集成了我們專門為工業數據采集開發的一個數據適配器,它完成多種工業協議與“數笈云”直接的協議和接口轉換。

北京水木聯合科技有限公司的解決方案

數據到了“數笈云”之后,我們提供一系列的認證、加密、安全、分布式計算、數據預處理功能。這層其實我們有一個核心技術,我們這個核心技術就是對物理系統的一個抽象規范,無論你是哪個品牌、哪個型號的設備,在進入“數笈云”的時候,我們已經利用我們的抽象規范,或者IT的語言,叫語音命名規范,對物理系統進行了抽象,這樣就可以方便進行一下步,數學模型的通用調用。這一步非常重要,因為工業領域和互聯網的一個重要差別,我覺得就是封閉,工業領域的大廠家各有各的規矩,大家互不,互不相通,如果要相通可能就通過OPC連一連,但實現工業互聯網的***步,就是要在數據準備階段,打破物理系統的封閉。

[[180022]]

這一步在技術上我們是用標簽庫實現的,目前“數笈云”中的物理系統抽象規范,是我們自己和行業專家在定義。我們準備在將來把這部分開源出來。

第二個產品是人工智能引擎叫功夫云。這一部分抽象規范目前是我們自己在和行業專家在定義,我們準備將來把這部分開源出來,提供給大家不斷補充,形成共同的標準,這樣每個行業都有這種物理系統的定義,比如說,一個鍋爐有哪些參數?我們該怎么定義它?一個典型的通用設備,一個變頻風機,該用哪些參數去來定義一個風機?

人工智能引擎叫功夫云

可能大家的叫法,不同的控制系統,不同的設備型號,大家叫法不一樣,但是在“數笈云”上,我們用標簽的方式,我們有建立一個大家共同認可統一的一個抽象規范,這樣我們的模型就可以直接去調用。這個產品的用戶可以是企業的業務人員,工藝專家,也可以是專業的數據分析人員,功夫云這個產品它的設計研發是依據我們的大數據挖掘計量模型實施方法論進行設計研發的,這個方法論分為六步,我給大家看一看這個圖,這六步從數據的準備和差異分析,模型規范要求,探索性數據分析,模型細分,確立最終模型,最終到模型驗證生成,因為今天時間有限,我在這里就不展開了,大家有問題可以微信私信我,或者給我打電話,我給大家詳細講解。

我們現在正在不斷提高這個方法論在功夫云中的自動迭代的效率,它背后采用的機器學習的算法,可以幫助客戶迅速完成數據的準備,算法的選擇,和模型的生成,很多的工作是自動形成,自動實現的,其實這也是跟很多的一些做數據分析咨詢的一些企業差別,在那個我們把很多的重復性的,初級的數據準備的活動,比如像我剛才談到常量的排篩查,數據的前空值的補充,數據的統計分布特征的選擇,針對什么樣的分布的特征數據采用什么樣的算法?

我們都已經做自動化的實現了,但這里邊也離不開業務專家我們在業務上一些理解,我們把很多的數據能夠最快的速度形成寬表,然后數據科學家來做***的模型的調試,一旦模型生成在功夫云上你可以將模型用刀客技術封裝成一個工業APP,這個APP干嘛用呢?它可以在線對模型所有的自變量的實時數據,進行實時監測和計算,輸出預測結果。那么依托這兩個核心產品,我們開發了預測性質量管理,安全風險預警,設備預測性維護,精準營銷一體化四個解決方案。

工業APP

這就是我們大概我們的產品的一個解決方案情況,下邊我用***的用結束前一點時間,我給大家分享一下我們在建筑陶瓷行業一個案例。企業是佛山一個建筑陶瓷企業,是國內一個知名品牌,我們和他們一起拿了一條窯,做一個工業大數據分析應用的示范項目,這個項目的目標是進行瓷磚生產過程中變形品的副品率的預測,因為我看好像大家有提問,那我這樣我先講完,然后咱們一起來解答。

這個項目的目標是進行瓷磚生產過程中變形品副品率的預測,結合生產過程數據,建立瓷磚變形品副品率的一個預測模型,同時分析生產過程中設備數據對副品率的影響,客戶目前的變形品副品率是在10%到30%之間波動,尤其而且在新產品生產的時候,副品率的波動會更大,但是企業通過傳統的工藝調整,也幾乎沒有什么更好的辦法去穩定他的副品率。那通過業務的考察,業務的理解和考察數據,我們定義數據模型輸出的一個結果,就是我們說的目標變量,預測每天每個產品生產批次的變形副品率,這是目標變量,那自變量來自于什么?

來自于陶器壓機,干燥爐、燒制爐工序的一些生產數據,那這里邊包括了,這里邊包括了壓機工礦的參數,風機頻率、電流、電表的功率因數,熱電溫度值,這樣近千個采集點,采集頻率是秒計。另外還有一些自變量是企業一些質量檢驗數據,工藝要求和訂單數據,企業為這個項目前面做了一些前期數據采集的一些前期改造,后來等我們拿到數據采集到數據運營以后,我們發現其實這個項目我們發現有這樣兩個主要的挑戰。

一是由于質量數據,按照生產批次進行每小時抽檢,所以質量數據的數據量,遠遠小于設備數據,數據很不平衡。我想這個我剛才在介紹工業大數據的一個特點的時候,大于小的矛盾統一的時候,其實反反復復提到,那我想各位以后在做工業大數據分析項目的時候,這個一定要注意到這一點。

第二,就是設備中的記錄的設備參數多達500多個,那么這些數據進行聚合后,它的變量更多。需要從海量設備參數中選取變形副品率相關的設備參數,我們在功夫云上實施了這個項目,最終我們是采用了拉鎖算法,和邏輯回歸算法,在近千個自變量中,找到了20幾個左右的獨立變量,建立了這些變量與變形副品率的預測模型,預測結果與實際值的均方跟差小于0.08。客戶還是能接受的比較滿意,同時我們通過跟客戶業務人員溝通,在這20多個獨立變量中,我們確定了11個變量作為關鍵變量。

那這個關鍵變量然后我們根據數據分布,按照期望的副品率界定了這些變量的一個正常范圍,也就是說一旦這個模型在線使用的時候,一旦實時采界值超過這個范圍,監測模型就會報警,就會提示變形副品率有突破目標值的風險。

模型工業APP在線使用的一個界面

這是我們給客戶做的這個就是模型生成以后,然后模型工業APP,在線來使用的時候一個界面,大家可以看到下邊儀表盤就是我們確定一個11關鍵變量,那么這11個關鍵變量,我們會為它設定了界定值,那么,這個界定值的依據,是由企業希望達到的變形品的副品率的控制要求來提出的。那客戶也還是比較滿意,這個項目得到了客戶的認可,目前正在進行二期的實施,我想今天很榮幸有機會在咱們協會總群里,給大家介紹了,給大家匯報了我們對于工業大數據,很人工智能技術,在智能制造領域的應用體會,謝謝。

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 江蘇CIO聯盟
相關推薦

2022-01-10 17:42:33

人工智能大數據技術

2017-09-18 14:31:05

工業物聯網智能制

2021-08-03 15:06:49

人工智能預測算法

2022-07-05 11:06:55

人工智能自然語言計算機

2023-10-07 07:48:41

人工智能質量技術

2021-04-22 22:40:20

人工智能智慧制造應用

2021-08-05 09:23:56

人工智能大數據物聯網

2017-08-30 16:40:56

2017-04-08 17:08:10

2017-04-17 09:02:47

2017-03-16 17:05:01

人工智能智能建筑應用展望

2023-09-13 07:04:34

人工智能建模SME

2022-01-07 13:06:43

人工智能AI

2020-06-01 08:34:41

人工智能AI工業應用

2018-06-12 16:24:25

人工智能電商搜索

2022-08-01 16:53:58

人工智能預測學工具

2016-04-20 09:49:08

2022-06-09 10:12:01

網絡安全人工智能威脅監測

2021-01-27 13:30:41

人工智能互聯網5G

2023-03-06 15:13:13

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品自拍视频 | 中文字幕国产精品视频 | 日本久久一区 | 欧美一区二区在线观看 | 成年人网站在线观看视频 | 亚洲精品一二区 | 在线不卡av | 国产精品久久av | 欧美日韩国产在线观看 | 日韩精品人成在线播放 | 伊人久久国产 | 狠狠久久综合 | 日韩视频中文字幕 | www.婷婷亚洲基地 | 综合视频在线 | 成人影院免费视频 | 国产成人精品免费 | 天天爽天天操 | 成人免费大片黄在线播放 | 免费国产视频 | 3级毛片 | 亚洲精品视频在线播放 | 久久久久久久久淑女av国产精品 | 国产羞羞视频在线观看 | 中文字幕在线人 | 久久精品日产第一区二区三区 | 国产精品免费在线 | av在线一区二区三区 | 中文字幕 欧美 日韩 | 久草.com| 国产精品福利视频 | 国产免费va | 国产99久久久久 | 国产日韩亚洲欧美 | 日韩免费 | 香蕉超碰 | 国产午夜精品一区二区三区在线观看 | av在线影院| 日本小电影网站 | www.操.com| 精品国产伦一区二区三区观看体验 |