成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

分享:我的第一次數據科學家實習經歷

大數據
在寫本文時,正是我在 Quantum Invention 做數據科學家實習生的倒數第二天。此刻,我坐在筆記本電腦屏幕前,再回想起過去幾個月的學習歷程,非常艱辛但充滿成就感。

「數據科學家」可謂是近幾年的一大熱門職位,很多學習了數學、信息、計算機相關專業的同學都對它表示躍躍欲試。Admond Lee 學習了物理專業,曾參加瑞典歐洲核子研究中心(CERN)的物理夏令營,而今他也走上了數據科學家的道路。近期他撰文回憶了自己的數據科學家實習經歷,編譯如下。

 

[[229562]]

Admond Lee:

在寫本文時,正是我在 Quantum Invention 做數據科學家實習生的倒數第二天。此刻,我坐在筆記本電腦屏幕前,再回想起過去幾個月的學習歷程,非常艱辛但充滿成就感。

旅程總有終點,但問題長存

––––你學到了什么?這就是你想要的嗎?

作為一個搞物理的人,請原諒我總是問正確的問題,以適當的回答來尋求真理。

事實上,作為一個數據科學家,提出正確的問題毫無疑問是重要的(后面將會解釋…)

給你們大致介紹下,這篇文章主要分為三個部分(實習前、實習期間和實習后)來講述我的實習旅程的經歷。根據你的目前的學習階段可跳轉到任意部分。讓旅程開始吧!

謝謝您!當我在 Medium 上發表的***篇文章時,我情緒高漲。因為其受到了非常多人的大力支持,甚至因其特色而發表在了 towardsdatascience.com 。這真的成為我繼續與更多的人分享我的學習經驗的動力,僅僅是因為學習樂趣,幫助他人變得更好!

實習之前

 

[[229563]]

我仍然清楚地記得,在 2017 年 11 月我的期末考試結束后,我開始閱讀課本,《統計機器學習入門—R語言的應用》。這是我在基本和統計層面上***次接觸到機器學習。

一旦我掌握了這些概念,我就開始學習一門流行的課程,那就是吳恩達在慕課上教的《機器學習》課程。一開始課程內容并沒有大家預想的那么容易,但是吳恩達卻一直能抓住大家的注意力,盡管許多概念都很復雜,但都能被他簡化以便于理解消化,似乎沒有其他人能做到。我想這就是我真正學會機器學習的原因。我敢打賭,試一試你就會知道機器學習這個熱門詞匯并不像聽起來那么復雜。

同時,我還學習了人工智能的另一個重點領域––––深度學習。回顧一下,這個看似外來用語其究竟是什么含義,請看神經網絡的解釋以及神經網絡可用來計算任何函數。好了,如果讀完了推薦的文章之后,還像我一樣,總是需要某種可視化以了解事物是如何工作的,那就請點擊這里,按「播放」按鈕,坐下來,放松,觀察神經網絡是如何用來做分類和回歸的。很酷,不是嗎?

所有的閱讀、學習和作業都為我 2017 年 12 月的實習做好了準備。

實習期間

 

[[229564]]

我申請的 Quantum Invention 公司致力于利用其集成的移動性應用套件、企業物流與分析平臺向消費者、企業和政府提供移動性情報。而我是***個加入 R&D 和分析團隊的數據科學家實習生。

在接下來的幾天里,我認識了許多同事,了解到各種行業術語,以及正在進行的令人興奮的項目。實習過程中我最喜歡的一點是信任和自由,作為實習生我可以自由選擇我感興趣的項目并全力以赴!

令我驚訝的是,我意識到我是***個開始這個項目的人,因為以前沒有人這么做過。當沒有人做過某事時,就需要研究,這是我感激的地方,盡管帶有不確定性和困難。為什么?僅僅因為我有機會體驗從零開始進行數據科學工作的整個流程(如果不是全部)。

請允許我列出我所經歷過的這些工作流程,因為這些建立了我的數據科學基礎。我希望你在某一天發現它有用。

1. 了解商業問題

所選擇的項目是短期高速公路行駛時間預測。看起來似乎非常簡單,然而就像我說的,問正確的問題對于數據科學家來說是非常重要的。在項目最終確定之前,提出了很多問題來真正理解真實的商業問題,包括數據來源、項目的最終目標(甚至在我離開之后)等。從本質上講,我們的目標是預測未來幾分鐘在新加坡高速公路的行駛時間且要比當前的基線估計更準確。

2. 采集數據

在新項目的激勵下,我開始從數據庫和同事那里收集數據(基本上是在辦公室四處走動,詢問數據源的問題)。收集正確的數據類似于從各種不同的數據網站中提取數據然后進行數據預處理的情況。這是非常重要的,它能影響你在后期構建的模型的準確性。

3. 數據預處理

真實世界的數據是臟的。我們不能指望數據像 Kaggle 提供的那樣格式整潔且沒有噪聲。因此,數據預處理(其他人可能稱之為數據整理或數據清理)是非常重要的,以至于我不得不多次強調它有的重要性。它是最重要的一個階段,因為它可以占據整個工作流的 40% 到 70% 的時間,只是為了清理數據以供你的模型使用。

我喜歡數據科學的一件事是你必須對你自己誠實。當你不知道你還不知道什么的時候,你就會開始覺得數據預處理已經足夠干凈,并準備把它用在你的模型上,此時就存在著用錯誤數據試圖建立正確模型的風險。

換句話說,總是不斷質疑自己,用你擁有的領域知識判斷數據在技術上是否是正確的,請嚴格而仔細地檢驗數據,以檢查在整個數據集中任何其他的離群值,缺失或不一致的數據。

有一次,我喂給模型的數據是錯誤的,只是因為在預處理步驟中的一個簡單錯誤,在犯了這個錯誤后我特別小心。

4. 建立模型

 

[[229565]]

經過研究,我提出了支持向量回歸(SVR)、多層感知器(MLP)、長短期記憶網絡(LSTM)和狀態空間神經網絡(SSNN)四種模型并用在我的項目中。此處不詳細展開,你可以在許多網站上找到每個模型的詳細解釋的資料。

對于一個像我這種仍在學習慕客課程以及教科書的人看來,從頭開始構建各種不同的模型是一個陡峭的學習路線。幸運的是,Scikit-learn 和 Keras(采用 Tensorflow 作為后端)算是我的一個救星,因為它們很容易讓你快速學習模型原型且是采用 Python 實現的。此外,我還學會了如何優化模型及使用各種各樣的技術微調每個模型的超參數。

5. 模型的評價

為了評估每個模型的性能,我主要使用以下的一些度量:

  • 平均絕對誤差(MAE)
  • 均方誤差(MSE)
  • 決定系數(R2)

在這個階段,上述步驟 3 - 5 被重復(互換)直到確定***模型能夠超過基線模型的估計精度。

實習之后

 

[[229566]]

嗯,實習已經印證加強了我對數據科學的熱情,我很感激我的實習工作,其確實為我將來工作帶來了一些動力。在研究和開發階段,與不同的利益相關者交談所需的溝通技巧、用數據來解決商業問題的好奇心和熱情等等方面都提高了我對此領域的興趣。

數據科學行業仍然很年輕,它的工作描述對我們這樣的求職者來說可能顯得模糊不清。不具備所有需要的技能是非常正常的,因為大多數工作描述是理想化的,以符合他們的***期望。

當有疑問時,只要從慕課、書籍和文章(我現在還在做的)中學習基本原理,然后通過你自己的個人項目或實習來運用你所學到的東西。要有耐心。學習之旅需要時間。津津有味地去開始你的學習旅程吧。因為…

旅程總有終點,但問題長存

–––– 你學到了什么?這就是你想要的嗎?

謝謝大家的閱讀。

責任編輯:未麗燕 來源: 網絡大數據
相關推薦

2017-08-04 15:53:10

大數據真偽數據科學家

2020-05-11 13:46:34

數據科學家數據科學大數據

2012-12-06 15:36:55

CIO

2018-12-24 08:37:44

數據科學家數據模型

2012-12-26 10:51:20

數據科學家

2018-11-19 06:00:32

數據科學家數據科學

2018-02-28 15:03:03

數據科學家數據分析職業

2021-02-05 08:35:21

私活程序員

2015-08-25 13:20:29

數據科學

2016-04-11 14:15:06

數據科學數據挖掘工具

2020-03-20 14:40:48

數據科學Python學習

2011-07-21 21:01:37

諾基亞塞班蘋果

2012-06-12 09:33:59

2018-10-16 14:37:34

數據科學家數據分析數據科學

2019-09-09 09:17:58

數據總監職場

2013-04-11 10:03:55

2021-03-27 10:57:37

數據科學家數據科學大數據

2013-04-01 10:27:37

程序員失業

2016-10-21 19:59:43

數據科學家數據科學

2018-03-01 15:34:20

數據科學面試招聘
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩视频 中文字幕 | 久久成人综合 | 久久久夜夜夜 | 欧美成人激情 | av中文网 | av性色| 欧洲精品码一区二区三区免费看 | 国产精品视频区 | 久草免费在线视频 | 国产精品免费一区二区三区四区 | 亚洲一区二区综合 | 久久精品小视频 | jizz在线免费观看 | 国产精品国产成人国产三级 | 国产真实精品久久二三区 | 九九久久免费视频 | 中文字幕亚洲精品 | 亚洲精品一区二区三区四区高清 | www.日韩欧美 | 日韩午夜 | 国产成人精品一区二区三区在线 | 日韩欧美三级电影 | 国产精品精品久久久久久 | 成人影视网 | 精品国产乱码久久久久久丨区2区 | 99久久精品免费看国产小宝寻花 | 日本免费小视频 | 96久久久久久 | 国产一区二区在线免费观看 | 婷婷久久综合 | 性做久久久久久免费观看欧美 | 激情三区 | 久久久免费电影 | 免费在线视频a | 欧美一区二区三区在线观看视频 | 水蜜桃久久夜色精品一区 | 中文字幕亚洲无线 | 蜜桃免费一区二区三区 | 欧美v片 | www精品| 欧美综合久久久 |