成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

企業如何實現對工業大數據的預處理?

大數據 CIOAge
數據分析,包括大數據分析,在企業的業務中,特別是在傳統的商務行業,已有多年的應用實踐,在消費者市場的營銷中已成了必不可缺的技術。隨著工業互聯網和智能制造的興起和發展,工業大數據技術也越來越受到各方關注。

數據分析,包括大數據分析,在企業的業務中,特別是在傳統的商務行業,已有多年的應用實踐,在消費者市場的營銷中已成了必不可缺的技術。隨著工業互聯網和智能制造的興起和發展,工業大數據技術也越來越受到各方關注。在“中國制造2025”的技術路線圖中,工業大數據是作為重要突破點來規劃的,而在未來的十年,以數據為核心構建的智能化體系會成為支撐智能制造和工業互聯網的核心動力。

對制造企業而言,不論是新實施的系統還是老舊系統,要實施大數據分析平臺,就需要先弄明白自己到底需要采集哪些數據。因為考慮到數據的采集難度和成本,大數據分析平臺并不是對企業所有的數據都進行采集,而是相關的、有直接或者間接聯系的數據,企業要知道哪些數據是對于戰略性的決策或者一些細節決策有幫助的,分析出來的數據結果是有價值的。

比如企業只是想了解產線設備的運行狀態,這時候就只需要對影響產線設備性能的關鍵參數進行采集。

再比如,在產品售后服務環節,企業需要了解產品使用狀態、購買群體等信息,這些數據對支撐新產品的研發和市場的預測都有著非常重要的價值。

因此,建議企業在進行大數據分析規劃的時候針對一個項目的目標進行精確的分析,比較容易滿足業務的目標。明確目標以后,就要著手開始搜集數據并進行預處理了。本期格物匯將跟大家介紹,企業如何實現對工業大數據的預處理。

數據采集

首先我們看看數據是如何獲取的,在現實生活中,我們所面對的問題,往往都是抽象復雜的。我們來看如下兩個例子:

如何提升產品的良率?

可能這是制造業最為普遍的一個問題,如果我們要分析解決這個問題,常常就會問到:什么產品?有多少條產線在生成?經過了哪些機臺?影響產品良率的因素有哪些?我們可能會提出很多很多這樣的問題,解決這些問題需要對相關業務知識非常了解,盡可能多的找出與問題有關的數據。

如何進行人臉識別?

這問題更加復雜一些,雖然我們每個人的大腦每天都在做人臉識別,但是大腦如何工作的卻異常難懂。我們可能需要做很多科研工作,去挖掘到底哪些數據會影響到人臉識別的正確率。如果這些數據本身沒有,很可能還需要進行測量采集,比如兩眼之間的距離,嘴的寬度和長度等等。當然,我們還會評估采集的成本,并對這些數據有效性進行評估,驗證我們的成本是否值得去花費精力測量。

數據預處理簡介

數據采集以后,數據往往存放在數據庫或文件系統中,我們需要把他們導入到算法模型中進行訓練,得到我們想要的模型。但是我們的數據往往雜亂無章,總的來說,數據一般存在如下幾類問題:

數據類型多種多樣

企業如何實現對工業大數據的預處理?

我們的數據中常常出現字符型,時間型,數字型等多種數據類型。其中:字符型是無法代入模型計算的,所以我們根據需要,可以對字符型數據進行編碼轉換。常用的編碼方法有:

數字編碼:對于有大小比較的字符型數據,可以直接轉換成數字編碼。比如:

企業如何實現對工業大數據的預處理?

Onehot編碼:對于沒有大小比較的字符型數據,可以使用Onehot獨熱編碼。比如:

企業如何實現對工業大數據的預處理?

時間類型往往是一類特殊的數據,把時間簡單看成一個實數的話,往往不符合邏輯。對于帶時間的數據,我們通常使用時間序列的分析方法進行分析。有時候我們更加關注的是兩列時間的差值,這時我們可以構建時間差值列作為新的變量加入模型之中。

數字型往往是導入模型進行訓練的主要部分,數字型又可以細分為離散型和連續型,因為離散與連續的數據分布顯著不同,我們可以對其進行分開處理。數字型之間各個列常存在量綱差異,有的數據可能很大,有的數據可能很小,我們需要去除數據量綱,防止模型對數據較大的列進行偏倚(數據值較大時通常方差也較大)。常用的數據去量綱的方法有***最小值歸一化法,均值標準差標準化法等等。

數據格式不對

我們期望數據格式是表結構,矩陣格式,或者是張量格式。然而我們拿到的數據往往不是格式化的數據,比如機臺的日志數據,圖像數據,音頻視頻數據。我們需要對上述數據轉換,把數據格式轉換成我們想要的格式。

企業如何實現對工業大數據的預處理?

數據中存在異常

數據中還會出現缺失值,異常值等異常,這些情況也會強烈影響到模型的訓練,我們需要對空值進行補值。如何補值需要我們對數據非常了解,才能推斷出該用什么值來補值,才不會改變原有的數據分布。一般的補值方法有:0值補值,均值補值,中位數補值,按上一個數補值,移動平均補值,線性插值,相關列補值法等等,對于缺失值比例較大的列,可以采取直接刪除的方法。異常值則需要創建規則,對異常值進行識別,再用正常的值進行替換,故異常值也有類似于缺失值的替換方法。

企業如何實現對工業大數據的預處理?

責任編輯:未麗燕 來源: OFweek工控網
相關推薦

2019-04-19 15:00:29

工業大數據數據分析企業

2018-01-18 22:09:06

數據分析數據處理企業

2019-01-09 11:05:29

大數據工業算法

2017-08-11 16:08:20

工業大數據制造業

2018-11-12 13:34:17

工業大數據制造業結構化數據

2015-11-26 17:49:05

商務大數據工業

2022-02-09 21:53:13

大數據工業大數據

2013-03-18 10:14:00

大數據小數據

2013-02-21 16:36:09

大數據

2020-11-23 11:09:28

大數據

2019-06-03 13:02:35

工業大數據工業互聯網大數據

2015-09-11 15:16:21

APM數據

2013-06-25 11:14:03

大數據

2017-09-18 14:31:05

工業物聯網智能制

2013-09-25 13:47:35

Oracle甲骨文

2017-11-28 17:41:39

大數據

2019-01-03 14:39:47

工業大數據互聯網數字經濟

2016-12-01 19:07:46

大數據數據分析

2020-05-14 10:07:12

大數據企業融資大數據應用

2020-05-15 09:56:37

大數據工業技術
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品欧美一区二区三区 | www国产亚洲精品久久网站 | 国产91久久久久久久免费 | 亚洲看片网站 | 日本黄视频在线观看 | 欧美日韩国产精品一区 | 精品国产欧美一区二区三区不卡 | 五月花丁香婷婷 | 91国产精品在线 | 91精品免费 | 欧美久久久久 | 国产一区二区三区四区hd | 精国产品一区二区三区 | 久久精品视频一区二区 | 成人中文字幕在线观看 | 亚洲欧美日韩中文在线 | 亚欧精品 | 视频一区二区国产 | 日本三级做a全过程在线观看 | www.日本国产 | 最新高清无码专区 | 一级片视频免费 | 久久久久久久久久久久91 | 久久精品久久精品久久精品 | 超碰在线97国产 | 干干干日日日 | 久久综合狠狠综合久久综合88 | 国产精品一区二区视频 | av网站在线播放 | 中文字幕精品一区二区三区精品 | 日韩一区二区在线视频 | 久久久99精品免费观看 | 国产一级免费视频 | 手机av在线 | 欧美国产视频一区二区 | 91豆花视频| 韩国理论电影在线 | 嫩草一区二区三区 | www.黄色网 | 亚洲第一成人av | 欧美综合一区二区 |