成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

沒有數據科學家大數據就玩不轉了?

云計算
如今, 一談到大數據, 一個普遍的說法就是人才的缺乏。 數據科學家成為了21世紀最性感的職業等等。 哈佛商業評論以及咨詢公司麥肯錫的報告都這么說, 再加上數據科學家們自身也樂意被打上這樣的標簽。

 [[106642]]

 

數據科學家被媒體譽為21世紀最性感的職業,是企業界身價不菲、一將難求的的超級明星,這嚇跑了很多準備嘗試大數據的企業,實際上沒有數據科學家企業一樣可以玩轉大數據。

如今, 一談到大數據, 一個普遍的說法就是人才的缺乏。 數據科學家成為了21世紀最性感的職業等等。 哈佛商業評論以及咨詢公司麥肯錫的報告都這么說, 再加上數據科學家們自身也樂意被打上這樣的標簽。

然而, 這種說法, 也讓很多準備考慮大數據戰略的企業面對大數據的機會望而卻步了。 那么, 如果缺少數據科學家, 企業的大數據就真得玩兒不轉了嗎? 其實也未必。

這里, 當然不是說數據科學家不重要。 相反, 數據科學家這個職業在大數據時代非常重要。 在企業中, 數據科學家的工作, 實際上是聯系企業的IT技術和企業所在行業專業知識的紐帶。 這樣的知識交集上的人才, 本身確實匱乏, 而且, 即使大數據又再大的發展,同時具備這樣的知識的人才也還是少數。 然而, 就像我們在計算機行業發展的早期, 不能說因為喬布斯, 蓋茨這樣的人才太少就制約了行業發展一樣。 如今, 街邊柯達店的小伙子都能用PS修人像, 而我們也不需要要求柯達店的小伙子具備編寫圖像處理軟件能力。

大數據時代也是一樣, Google, Twitter, Facebook那樣的大公司, 可以負擔得起那些高精尖的數據科學家, 而小企業, 也可以有自己的方式來更好地利用數據。 下面, 以電子商務的公司為例子, 結合數據科學家的工作, 來看看如何能夠在企業現有能力范圍內進行數據方面的工作。

數據科學家的工作, 大致分為三個方面:

第一, 數據架構的搭建, 第二, 數據模型的建立, 第三, 數據分析。

下面我們來看看那些雇不起或找不著數據科學家的屌絲企業如何玩轉大數據:

數據架構的搭建:

首先, 確定企業對數據的需求點。 對絕大部分商業企業來說, 其實每個業務經理都可以告訴你, 他們所需要的數據就是用戶行為的數據, 比如, 用戶購買行為, 用戶對促銷或者廣告的反應, 用戶的社交信息等等, 基本上, 每一類這樣的信息, 都可以比較容易的進行歸類。

這里的關鍵, 就是盡量把需要的數據范圍進行限定, 這樣就可以設定一些簡單的數據輸入模板, 從而把數據采集和數據整理問題簡單化。 這里可以采用一些開源工具, 如Hadoop, Hbase, Hive, Pig等, 把各類數據進行整合。 2/8 原則一般是適用的, 也就是, 80%的進行運營支撐的需求可以來自于20%的數據。 對企業來說, IT技術人員和業務專家共同的協作, 加上一部分外部咨詢的幫助, 應該可以搭建一個可用的架構。

數據模型的建立

數據科學家的另一部分工作就是數據模型的建立。 這些模型可能是描述型的模型, 也可能是預測性的模型。 這部分的工作, 也是數據科學家經常被神化的部分。 其實, 這部分工作, 比如說推薦系統, 用戶個性化系統等等。 數據科學家所做的大量工作, 在于提取數據的“特征”, 選擇合適的模型, 并把它們輸入模型, 等待模型輸出結果, 再驗證, 調整特征的循環。 這部分的工作, 需要第一, 熟悉各類統計模型或者機器學習模型的建立。 第二, 也是更重要的一點, 就是行業知識的了解。 比如一個推薦系統, 最重要的就是把提取用戶特征, 提取商品的特征。 如果建模的人對行業知識不了解的話, 那么模型就會很龐大和復雜, 也未必精確。 在這里, 行業的專家, 盡管對建模未必很精通, 他們的市場感覺往往是選擇合適特征值的關鍵。

因此, 對電商企業來說, 招幾個學統計的員工(或者外包), 再配合企業內部的行業專家, 也可以建一些適合企業需要的基本模型。 也許沒有Google或者Facebook那么地精確, 但是對絕大部分企業來說, 也夠用了。 這也不失為是一條在找不到合適的數據科學家(事實上精通本行業又精通建模的人才本來也是鳳毛麟角)的情況下的解決之道。

數據分析

數據分析的本質, 是把“數據”變成“信息”, 并從中發現對企業運營有價值的東西。 這其實和任何理科或者工科的“觀察 — 歸納 —關聯 — 分析 —驗證”的研究方法從本質上是一致的。 從這個角度來講, 行業的專業知識, 在數據分析的時候, 更加重要。

即使你把歐洲大型強子對撞機的數據給數據科學家, 他也發現不了“上帝粒子”。

國內的很多人都會津津樂道 美國百貨公司Target通過數據分析給懷孕少女推送嬰兒產品的例子,而很多數據分析師或者數據科學家在提到這樣的例子的時候, 也在有意無意的進行誤導。 其實, 如果沒有對用戶和產品方面的專業知識, 光靠數據分析或者數據模型, 是很難做到的。 而事實上, 任何機器生成的模型, 要想實用的話, 也都得需要人工在反饋路徑上進行一定程度上的調整。

在數據分析領域, 已經有很多的分析工具。 然而, 現在的這些工具, 大多數也還是比較復雜。 需要類似數據科學家或者數據分析師這樣的專門人員來使用。 由于企業精細化運營的程度普遍不高。 數據分析師或者是BI的分析師本來就稀缺, 更不要說精通行業專業領域知識同時具備數據分析工具使用能力的人才了。 一個解決的方式, 就是把常用的分析盡量模板化, 數據的整理盡量簡化。 盡量采用Excel這樣簡單大眾的分析工具。 歸根結底, 企業進行數據分析的目的, 是為了經營服務的。 簡單的工具, 在使用,分享和溝通方面都有優勢。 這樣的解決方案當然不算得完美, 但是, 如果能讓具備豐富行業經驗的專家以行業經驗來彌補數據分析工具的不足, 對企業來說, 也算得上是一個在缺乏數據科學家情況下的可以從數據分析中獲益的方式。

在大數據時代, 數據科學家的重要性當然是毋庸置疑的。 不過, 就像網站內容管理系統那樣, 大型網站可以雇頂級工程師來自建系統。 小企業也可以利用WordPress這樣的系統來滿足自身的需求一樣。

企業在這個人才匱乏的大數據時代, 利用已有的工具, 結合自身對行業的專業知識, 采取合適的策略, 同樣也可以從數據和數據分析中獲益。

對于那些準備淘金大數據的企業來說,還有一個好消息是:ClearStory這樣的創業公司正致力于大數據的可視化和易用化,讓那些雇不起高水平數據科學家的企業,以及非IT部門的業務人員也能使用大數據。正如電腦進入windows時代后,普通用戶操作電腦不再需要逐條記憶繁冗的DOS命令行。

原文鏈接:http://www.ctocio.com/hotnews/10429.html

責任編輯:王程程 來源: IT經理網
相關推薦

2012-12-26 10:18:47

大數據數據科學家

2017-08-04 15:53:10

大數據真偽數據科學家

2013-11-12 09:27:01

大數據科學家大數據

2015-10-16 09:44:51

2012-12-26 10:51:20

數據科學家

2018-12-24 08:37:44

數據科學家數據模型

2013-05-10 09:28:14

大數據數據科學家SAS

2012-12-25 09:58:50

數據科學家大數據

2018-02-28 15:03:03

數據科學家數據分析職業

2018-10-16 14:37:34

數據科學家數據分析數據科學

2012-06-12 09:33:59

2015-10-08 10:09:42

2013-11-13 10:20:19

數據科學家大數據Gartner

2016-08-17 09:50:27

大數據數據科學家

2018-08-20 19:24:40

數據科學數據清理數據分析

2012-12-06 15:36:55

CIO

2019-08-26 09:47:56

數據科學家數據分析

2014-07-03 09:38:19

2012-12-27 09:52:23

數據科學家大數據

2015-08-25 13:20:29

數據科學
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 99爱国产 | 免费a v网站 | 成人免费在线观看 | 成人一区二区三区在线观看 | 国产精品免费看 | 日韩av在线一区二区 | 久久久www成人免费无遮挡大片 | 毛片网站免费观看 | 久久人人爽人人爽人人片av免费 | 欧美11一13sex性hd | 欧美色综合一区二区三区 | 免费av一区二区三区 | www免费视频 | 中文成人在线 | 91久久精品视频 | 久久首页 | 免费观看一级毛片 | 国产欧美精品一区二区 | 亚洲成人在线网 | 特黄小视频 | 欧美日本亚洲 | 久久久中文 | 日本精品裸体写真集在线观看 | 午夜在线免费观看视频 | 日日干日日 | 色吊丝在线 | 国产1区在线| 国产三级电影网站 | 欧美电影一区 | 久精品久久| 女生羞羞视频 | 天天爱天天操 | 久久久久久国产精品 | 91激情电影 | 中文字幕精品一区 | 欧美在线观看一区 | 久久久久久九九九九九九 | 美女人人操 | 亚洲精品久久久久中文字幕欢迎你 | 亚洲精选一区二区 | 美女黄网站视频免费 |