成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

給有抱負的數(shù)據(jù)科學家的六條建議

大數(shù)據(jù)
對于一個想轉行開始數(shù)據(jù)科學生涯的畢業(yè)生或數(shù)據(jù)分析人員來說,要在這個領域做一些事來展現(xiàn)自己的技能是很有挑戰(zhàn)的。我會同時站在企業(yè)招聘數(shù)據(jù)科學家的角度和求職者應聘數(shù)據(jù)科學家的角度,來談一談這個職業(yè)需要的幾點關鍵經(jīng)驗。

現(xiàn)在數(shù)據(jù)科學的需求量很大,似乎一部分原因是因為數(shù)據(jù)科學家需要有從業(yè)經(jīng)驗。但其實,許多那些和我工作過的數(shù)據(jù)科學家都來自不同的背景,從人類學到神經(jīng)科學都有,而且要有實踐經(jīng)驗才能脫穎而出。對于一個想轉行開始數(shù)據(jù)科學生涯的畢業(yè)生或數(shù)據(jù)分析人員來說,要在這個領域做一些事來展現(xiàn)自己的技能是很有挑戰(zhàn)的。我會同時站在企業(yè)招聘數(shù)據(jù)科學家的角度和求職者應聘數(shù)據(jù)科學家的角度,來談一談這個職業(yè)需要的幾點關鍵經(jīng)驗:

[[262131]]

  • 親自嘗試過云計算
  • 創(chuàng)建過一個新的數(shù)據(jù)集
  • 能夠將各種信息關聯(lián)起來
  • 提供一個服務
  • 做過酷炫的可視化
  • 寫過白皮書

我將在后面詳細解釋以上幾點。但首先,數(shù)據(jù)科學領域最關鍵的要義還是要能夠創(chuàng)造出能為企業(yè)創(chuàng)造價值的數(shù)據(jù)產(chǎn)品。一個能夠創(chuàng)造端到端數(shù)據(jù)產(chǎn)品的數(shù)據(jù)科學家是企業(yè)的寶貴財富,因此應聘數(shù)據(jù)科學家的時候,很必要去證明你有這些技能。

1、親身嘗試云計算

現(xiàn)在許多公司都在找有云計算經(jīng)驗的數(shù)據(jù)科學家,因為云平臺提供的工具可以擴大 數(shù)據(jù)流和預測模型的規(guī)模。未來你也可能在日常工作中用上一個云平臺,比如亞馬遜的AWS和谷歌云平臺(GCP)。

好消息是許多平臺提供了免費版從而讓更多人能夠了解云平臺。比如AWS就有免費版的EC2實例和免費使用的服務(比如支持少量請求的Lambda),GCP則提供給用戶300美元的免費額度用來試玩平臺上的絕大部分功能,而Databricks則提供了社區(qū)版本的平臺。雖然你不能在這些平臺上免費跑大數(shù)據(jù)集,但是你可以積累在平臺親身實踐的經(jīng)驗。

我的一個建議是你可以嘗試這些平臺的不同功能,去看看你是否能夠用一些工具去訓練及部署模型。比如我在一篇講模型類服務的文章中,用了我熟悉的SKlearn,并且研究了如何把一個模型包裝成Lambda函數(shù)。

2、創(chuàng)建一個新的數(shù)據(jù)集

在課堂上或者在數(shù)據(jù)科學比賽中,你經(jīng)常需要一個干凈的數(shù)據(jù)集,從而使整個項目能集中在數(shù)據(jù)探索和數(shù)據(jù)建模上。然而,在很多實際項目中,你需要做數(shù)據(jù)整理,從而將原始數(shù)據(jù)集轉換成一個更有利與分析建模的數(shù)據(jù)集。通常,數(shù)據(jù)整理需要收集額外的數(shù)據(jù)集去做數(shù)據(jù)轉換。比如我曾處理過美聯(lián)儲的數(shù)據(jù)來更好地理解富裕家庭的資產(chǎn)配置情況。

這是一個有趣的項目,我用了第三方數(shù)據(jù)去評估一手數(shù)據(jù)的準確性。所以我的第二個建議是進一步深入實踐,去構建一個數(shù)據(jù)集。這個過程會可能包含從網(wǎng)站爬取數(shù)據(jù),從數(shù)據(jù)統(tǒng)計網(wǎng)站(如steamspy)采樣數(shù)據(jù),又或者要整合不同數(shù)據(jù)源從而創(chuàng)造一個新的數(shù)據(jù)集。例如,我在研究生期間創(chuàng)造了一個星際爭霸(StartCraft)比賽回放的數(shù)據(jù)集,這就能證明我有能力在一個新生成的數(shù)據(jù)集上做數(shù)據(jù)整理。

3、將各種信息關聯(lián)起來

有一種能力我會希望數(shù)據(jù)科學家去展現(xiàn):就是能將不同的組件或者系統(tǒng)連接起來從而完成一項任務。在數(shù)據(jù)科學家這個角色中,也許沒有一個清晰的路徑來使模型產(chǎn)品化,所以你可能需要構造一些獨特的東西讓系統(tǒng)跑起來。一個理想化的數(shù)據(jù)科學團隊會有工程師來做系統(tǒng)搭建及運行,但是原型開發(fā)對數(shù)據(jù)科學家來說其實是一個很棒的技能,它可以讓你跑得很快。

關于這點,我的建議是去嘗試將不同的系統(tǒng)或組件整合進數(shù)據(jù)科學工作流中。這個嘗試可以包含用一些工具比如Airflow去開發(fā)一個數(shù)據(jù)管道。也可以包含搭建連接不同系統(tǒng)的橋梁,例如我在JNI-BWAPI項目中,就開發(fā)了基于Java的接口來連接星際爭霸:母巢之戰(zhàn)的API庫。或者可以包含將不同的組件整合到一個平臺上,比如用GCP數(shù)據(jù)流(DataFlow)來獲取BigQuery的數(shù)據(jù)然后應用到預測模型上,再把預測結果儲存到云數(shù)據(jù)存儲(Cloud Datastore)上。雷鋒網(wǎng)雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))雷鋒網(wǎng)

4、提供一個服務

作為數(shù)據(jù)科學家,你將經(jīng)常需要提供服務來讓公司的其他團隊使用。舉例來說,這可以是一個Flask應用,用來給出一個深度學習模型的計算結果。如果你能夠開發(fā)出這個服務,這意味著其他團隊將能更快地使用到你的數(shù)據(jù)產(chǎn)品。

關于這點,我的建議是嘗試使用一些工具(比如Flask或者Gunicorn)去配置web端點(endpoint),然后用Dash在Python中創(chuàng)建交互式的web應用。當然,在Docker中嘗試配置這當中的一些服務也會對你頗有幫助。

5、做過的酷炫的可視化

雖然偉大的工作自然會脫穎而出,但在你解釋一個分析或模型如何重要之前,仍有必要獲得眾人的關注。關于這點,我的建議是學習各種可視化工具來創(chuàng)建一個引人入勝的數(shù)據(jù)可視化。

可視化同時還能改進一系列的工作。

下面的博客展示了我作為數(shù)據(jù)科學家在過去10年中發(fā)現(xiàn)的一些工具和數(shù)據(jù)集。

做數(shù)據(jù)可視化的10年:

https://towardsdatascience.com/10-years-of-data-science-visualizations-af1dd8e443a7

6、寫白皮書

在數(shù)據(jù)科學的所有技能中,有一項一直以來我都十分推薦,那就是能夠通過白皮書來解釋項目。白皮書是一種概要,它探討了研究如何被應用,并提供了關于研究方法和結果的詳細介紹。白皮書是為了讓更多的讀者一目了然地理解你的研究,并且使其他數(shù)據(jù)科學家也可以在你的基礎上繼續(xù)研究。

博客或其他形式的輸出都可以很好地增加寫作經(jīng)驗。我對這點的建議是嘗試去面向大眾寫一些數(shù)據(jù)科學的文章,這樣當你要表達你的想法時,你會知道如何針對不同人群闡釋不同程度的細節(jié)。

結語

數(shù)據(jù)科學需要對很多工具有實踐經(jīng)驗。幸運的是,其中越來越多的工具降低了使用門檻,并且讓構建數(shù)據(jù)科學的工作組合變得越來越容易。

作者介紹:Ben Weber,Zynga首席科學家,Mischief顧問。

 

責任編輯:未麗燕 來源: 網(wǎng)絡大數(shù)據(jù)
相關推薦

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學家

2010-10-08 15:42:09

2011-10-09 16:27:39

移動互聯(lián)網(wǎng)創(chuàng)業(yè)

2018-10-16 14:37:34

數(shù)據(jù)科學家數(shù)據(jù)分析數(shù)據(jù)科學

2018-02-28 15:03:03

數(shù)據(jù)科學家數(shù)據(jù)分析職業(yè)

2012-12-27 09:50:36

Facebook

2015-08-25 13:20:29

數(shù)據(jù)科學

2016-04-11 14:15:06

數(shù)據(jù)科學數(shù)據(jù)挖掘工具

2020-03-20 14:40:48

數(shù)據(jù)科學Python學習

2012-12-26 10:51:20

數(shù)據(jù)科學家

2012-12-06 15:36:55

CIO

2018-12-24 08:37:44

數(shù)據(jù)科學家數(shù)據(jù)模型

2018-03-12 12:44:59

數(shù)據(jù)科學家人工智能數(shù)據(jù)科學

2020-06-17 07:00:00

Java數(shù)據(jù)科學家

2022-09-07 23:54:17

機器學習無監(jiān)督學習算法

2015-06-17 14:41:27

2015-06-11 10:27:29

數(shù)據(jù)科學家

2019-07-05 10:29:17

大數(shù)據(jù)數(shù)據(jù)科學家

2016-05-11 10:36:16

數(shù)據(jù)科學家數(shù)據(jù)科學大數(shù)據(jù)

2018-03-01 15:34:20

數(shù)據(jù)科學面試招聘
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 99免费精品 | 亚洲一区电影 | 偷拍自拍在线观看 | 中文字幕在线精品 | 国产999精品久久久久久 | 国产精品久久久久久亚洲调教 | 国产日韩欧美激情 | 欧美一区在线视频 | 久久亚洲欧美日韩精品专区 | 日韩不卡视频在线观看 | 美女艹b| 国产亚洲一区二区精品 | 久久久久国产精品一区二区 | 久久精品二区 | av在线播放不卡 | 中文字幕亚洲欧美 | 亚洲精品二三区 | 一区二区三区高清在线观看 | 91福利影院| 久久精品网| 日一区二区 | 天天综合永久入口 | 亚洲成人免费 | 日韩精品一区二区三区视频播放 | 激情福利视频 | 亚洲精品免费在线 | 成人免费网站视频 | 亚洲精品丝袜日韩 | 伊人免费在线观看 | 在线免费观看黄视频 | 久久精品国产久精国产 | 男人天堂久久 | 国产一级片 | 亚洲三级视频 | 午夜天堂精品久久久久 | 一级毛片免费完整视频 | 在线观看成年人视频 | 国产真实精品久久二三区 | 97精品国产97久久久久久免费 | 日韩欧美一级 | 国产精品久久久久久av公交车 |