成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

數據科學50年,數據科學家是否依然是21世紀最性感的職業?

大數據
在如今的數據智能時代,幾乎所有人都相信“數據的真實價值就像漂浮在海洋中的冰山,第一眼你只能看到冰山一角,而絕大部分則隱藏在表面之下。”當數據的價值依然在冰山之下隱藏,外面的世界便彌漫著對數據的渴望。

在如今的數據智能時代,幾乎所有人都相信“數據的真實價值就像漂浮在海洋中的冰山,第一眼你只能看到冰山一角,而絕大部分則隱藏在表面之下。”當數據的價值依然在冰山之下隱藏,外面的世界便彌漫著對數據的渴望。

 

[[328221]]

一些新的職業成為數據海洋里的新星,“數據科學家”無疑是最亮的之一,它被譽為21世紀最性感的職業,但是近年來隨著平民數據科學家的發展,有人指出數據科學家將要消失,也有國外相關人士建議不要去選數據科學家這個職業,數據科學家還是21世紀最性感的職業嗎?

數據科學五十年仍是少年

數據科學家泛指數據科學的從業者,追溯數據科學家的源頭可以到數據科學誕生的1966年,當時Peter Naur提出"數據科學"(“DataScience”起初叫"datalogy "),用來代替"計算機科學"。1996年,International Federation of Classification Societies (IFCS)國際會議召開。數據科學一詞首次出現在會議(Data Science, classification, and related methods)標題里。

在2000年代中期數據科學家職位開始出現,2009年Natahn Yau指出數據科學家是是采用科學方法、運用數據挖掘工具尋找新的數據洞察的工程師,數據科學家集技術專家與數量分析師的角色于一身。

實際上大數據和數據科學在內的整個數據行業最初都是由Google、Facebook、Twitter等互聯網巨頭驅動,現在仍然如此。總部位于歐洲的JetBrains是國際知名軟件開發工具提供商,其產品經理Andrey Cheptsov認為互聯網巨頭能夠推動數據行業的發展首先有所需求、并有能力進行大規模有效處理數據,其主要業務模型從核心上取決于自身處理大規模數據的效率。

隨著大數據行業的發展,數據科學家成為了職場新星,更是被財富雜志譽為21世紀最性感的職業。但是數據科學家在初期成長也并非一帆風順,根據商業智能公司SiSense在2012 年左右的一項報告,在接受調查的全球400位數據科學家和數據分析人士中,59%的數據科學家在從業六年后都另謀高就。盡管該職業的報酬豐厚,其中超過半數表示對職業安全性的擔憂。

彼時麥肯錫等咨詢公司力挺數據科學家,堅信數據科學家是當今和未來稀缺的資源。隨著智能手機的普及移動互聯網的發展,數據價值越發凸顯,數據科學家水漲船高。LinkedIn 發布的《2017 年美國新興工作崗位報告》中指出,“自 2012 年以來,數據科學家的職位增長了 650% 以上”且“數百家企業都在招聘這些職位”。

國內近幾年也有互聯網公司近幾年開始逐步設立獨立的數據科學(DataScience)團隊,推動公司向數據驅動發展。進入21世紀20年代,數據科學家成為更稀缺的資源,很多人也依然相信它還是21世紀最性感的職業。

不過榮譽傍身的新星也有“暗淡”的一面,2017年有研究指出數據科學家成為離職率最高的職位之一,通常他們每周都會花費一定的時間尋找新工作。日前仍然有數據科學家從業者勸諫后來者不要入坑,可謂是冰火兩重天,何以至此?

數據科學五十年依舊是少年模樣,就如同“AI”這個名詞在1956年出現到如今60多年才有初步落地,數據科學是一個綜合性的學科,國內外很多從業者認為數據科學依然是探索性的工作,管理層對 “數據科學” 的含義往往沒有達成共識。

雖然已經經過至少10多年的發展,現在可能受限于業務,沒有辦法生搬硬套一個角色框架給數據科學家,企業也容易將數據科學家和數據工程師混淆。JetBrains產品經理Maria Khalusova認為“數據科學家”和“數據工程師”這兩種職位角色在行業中還是相當新的,也正因此,通常沒有明確的職責劃分。“我們看到在某些公司中由數據科學家承擔的職責,在其他公司中這些職責卻由數據工程師承擔。另一個越來越常見的新角色是機器學習工程師,但也是同樣的情況,他們也經常與數據工程師發生重疊。”Maria Khalusova在接受IT168采訪時指出。

數據科學家VS數據工程師

新的技術融入產業和社會必然會帶來一場職業的辭舊迎新,這個過程并沒有那么快速。

“從技術角度來看,數據科學在某些情況下的實踐似乎還不如傳統軟件開發成熟。企業可能會面臨以下挑戰:建立可重現的機器學習管道,對數據和模型進行版本控制以進行審核,與快速發展的技術保持同步。”Maria Khalusova指出。

數據科學家和數據工程師的角色兩者有許多共同的特點和共技能。這些重疊的技能包括處理和操作大數據集、應用數據的編程技能、數據分析技能以及對系統操作的總體熟練程度。不過兩者還是有很大的不同。在筆者之前翻譯的文章中也強調了數據科學家和數據工程師不可能合二為一,為了從數據中獲得價值,大多數企業組織都需要數據科學和數據工程,由于相關技能有很大差異,二者合體也不太現實。企業組織可能需要多個數據科學家和數據工程師,但兩者之間的比例很少是1:1。對于大多數企業組織來說,擁有更多的數據工程師比數據科學家更有意義。因為數據科學家已經學會處理大量的干凈數據,但是從許多不同系統獲得大量的干凈數據更難也更具挑戰。與抽象數據模型和對數據集運行分析相比,移動和清理數據的工作量更大。

從技能需求方面也有很大的差異,Maria Khalusova認為,廣義上來講,數據工程師通常必須熟悉那些為分布式數據處理而設計的工具,例如Apache Spark、Apache Hadoop、Apache Ignite等。他們要具備數據倉庫和數據湖方面的經驗,因為他們需要能夠熟練地使用Java、Scala和Kotlin等JVM語言,并且必須能夠創建和維護大多數數據基礎架構。

數據科學家則需要了解Python語言、R語言或兩者兼具,并且能夠獲取數據(例如使用SQL或Spark)、整理數據、分析數據、訓練預測模型并將數據驅動的洞察提供給利益相關者。他們需要在統計方法和機器學習方法(包括深度學習)方面有扎實的基礎。在某些公司中,數據科學家也會參與機器學習模型的部署。

盡管現在很多企業對于數據科學家和數據工程師職位的劃分還不是那么明確,但是未來更加精細化的分工是大勢所趨。當然這并不會一蹴而就,新職位不是憑空而來,需要一個漸進的過程和角色轉化,國內某頭部互聯網公司兩年前正式組建了數據科學團隊,而團隊成員以前散落在集團各業務部門,其中有數據分析師也有大數據專家,而數據科學團隊成立以來,讓數據驅動業務運營,更加高效。

國內另一家頭部直播平臺正在招聘數據科學家職位,從招聘信息描述來看,數據科學家屬于其數據分析部,其工作職責包括分析和挖掘海量數據,發現用戶行為模式與規律,優化用戶體驗,提升社區粘性,通過數據分析和經濟運籌模型優化,為公司不同的運營團隊制定目標和策略,關注落地結果等。而職業技能要求需要熟練使用SQL、Python或R語言進行數據分析、可視化呈現,具有統計學和概率論基礎,擅長數據分析,了解常見規統計機器學習模型及使用等,其需求與Maria Khalusova所說基本一致。

有分析稱近來對AI、機器學習(ML)、非ML預測分析和“大數據”的應用,使得數據科學家的需求有了顯著的增長。不過從這一點來看數據科學是不是21世紀最性感的職業還為時尚早,公民數據科學家的到來讓不少人為此打上了大大的問號。

全民數據科學家時代到來?

早在2013年就有專家指出對數據科學家的“炒作”該結束了,他們認為大數據走入了一個新的階段。企業用戶利用直覺和互動的UI來從大數據中獲取價值,從而避免依賴于數據科學家,應該讓大數據變得更加民主。

市場競爭加劇,外部環境和技術飛速變化,需要業務和技術更高效聯動更及時有效了解用戶需求,明確企業自身現狀,為企業決策提供幫助。隨著大數據技術不斷走向成熟,技術應用的門檻也不斷降低,復雜的數據統計可能仍限于數據科學家,一些可視化分析工具和敏捷的大數據工具可以讓業務人員能夠輕松上手,大數據民主化也催生出了公民數據科學家這個概念。

根據Gartner 的定義,公民數據科學家(Citizen Data Scientist )“能夠創建或生成采用高級診斷分析或預測和規范功能的模型,但本職工作并不屬于統計和分析領域”,近兩年關于公民數據科學家概念也異常火爆。

有人指出公民數據科學家發展預示著全民數據科學家時代的到來,數據科學家可能會退出舞臺,也有人認為數字化智能時代,數據的增長和數據價值的重要性日益凸顯,企業對數據科學家和數據分析人員需求不斷擴大,而人才缺口較大,公民數據科學家是暫時填補供需之間不平衡的一個方案,數據科學家仍然是最亮的星。

可以看到近兩年技術民主化成了熱點,不只是公民數據科學家,還有公民開發者,在Gartner的定義中公民開發者是指在傳統IT渠道之外的創建應用程序的業務用戶,低代碼/零代碼的發展促使了全民開發者時代的到來。公民開發者無法替代開發者,同樣的公民數據科學家也無法替代數據科學家。術業有專攻,數據科學家會向著更高階和更專業的數據分析方向發展,正如Gartner所說,公民數據科學家可以彌合企業用戶采用的主流自助型分析和數據科學家掌握的高級分析技術之間的鴻溝。

目前,越來越多的企業構建數據文化,將自身打造成數據驅動的組織。“由于技術公司蘊含的技術文化,也使他們(互聯網企業)自然地在數據工程和數據科學方面更加領先。今天,我們看到越來越多的公司開始接受技術文化,因為這已成為競爭優勢所在。與此同時,同樣的事情也發生在傳統產業。今天,各行各業的許多公司都開始嘗試將其業務轉到互聯網上。可以這樣說,未來所有公司遲早都會成為互聯網公司,也都會更加注重技術文化。”Andrey Cheptsov指出,與此同時軟件開發越來越多地涉及到數據,這意味著軟件不再僅僅是一組算法,而是一組經過數據訓練的模型。收集和處理這些數據,并進行建模和部署機器學習(ML)模型,已成為軟件開發的一部分。

技術不斷迭代進化,新的職位也會出現,員工與企業組織都面臨著新的挑戰與機遇。很多人都愿意相信數據科學家未來可期,只是不要把職業角色和應該掌握的技能標簽化,畢竟需求是動態變化的,是需要個體與時代彼此適應的。

 

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2012-10-09 13:41:09

數據科學家職業

2020-03-23 13:43:00

數據科學家大數據數據

2014-03-07 10:33:05

IT

2012-10-09 10:18:27

2015-08-25 14:03:46

數據科學

2019-03-06 08:37:46

數據科學數據科學家Python

2018-02-01 16:25:55

2017-08-04 15:53:10

大數據真偽數據科學家

2015-09-30 09:26:38

大數據高薪

2012-12-24 09:54:06

大數據數據科學家

2021-10-29 15:19:44

人工智能金融科學

2019-12-30 22:24:50

大數據機器學習文章

2019-08-26 09:47:56

數據科學家數據分析

2015-06-11 10:27:29

數據科學家

2012-12-26 10:51:20

數據科學家

2018-12-24 08:37:44

數據科學家數據模型

2018-02-28 15:03:03

數據科學家數據分析職業

2018-11-05 17:33:34

數據科學家數據分析數據

2018-04-22 07:36:04

2019-11-22 19:54:46

戴爾
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲欧美日韩精品久久亚洲区 | 久久影院一区 | 日韩网站免费观看 | 天天干视频网 | 日韩中出 | 91成人免费观看 | 91大神在线资源观看无广告 | 午夜免费福利片 | 亚洲 欧美 另类 综合 偷拍 | 成人动慢 | 日韩久草 | 性色视频 | 欧美a在线| 中文字幕免费视频 | 久久久久久久久久久久久久国产 | 久久四虎 | 99热激情| 自拍亚洲 | 欧美综合国产精品久久丁香 | www.国产精| 玩丰满女领导对白露脸hd | 激情视频一区 | 国产丝袜一区二区三区免费视频 | 国产91久久久久久久免费 | 中文字幕久久精品 | 在线视频中文字幕 | 亚洲精品国产区 | 日韩精品不卡 | 免费国产视频 | 国产一级片免费看 | 超碰成人免费 | 欧美色综合网 | 97成人在线 | 一区二区三区免费 | 亚洲日本国产 | 亚洲一区网站 | 一区二区不卡 | 亚洲电影一区二区三区 | 亚洲欧美日韩电影 | 人人操日日干 | 天天草天天射 |