成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

我從高效數據科學家那里偷走的15個習慣

企業動態
當涉及到數據科學領域時,你需要使用一些書中的所有技巧,以使自己獲得一個使你超越終點的優勢。那么,為什么不嘗試一下行業的良好習慣呢?

[[389961]]

大數據文摘出品

來源:medium

編譯:在赤道的熊貓

當涉及到數據科學領域時,你需要使用一些書中的所有技巧,以使自己獲得一個使你超越終點的優勢。

那么,為什么不嘗試一下行業的良好習慣呢?

本文并不是成為高效數據科學家的“快速致富”方法。相反,它分享了幫助好的數據科學家達到他們現在的位置的習慣。

人們常說,數據科學家的價值取決于他們對組織的影響。這種影響起始于通過養成良好習慣成為一名有效的數據科學家。

與時俱進

僅在過去十年左右的時間里,出現了多少當前的數據科學技術?他們中的大多數。

帶著想要在數據科學領域做出巨大成就的動機,你已成為終身學習的一員。不用擔心,它聽起來并不那么可怕。

但是,你任何時候都應該記住的是,你需要與時俱進。因此,如果你一生都在使用MATLAB進行數據分析,請嘗試學習使用Python來編程。如果你一直在使用Matplotlib來可視化數據,請嘗試使用Plotly進行一些創新。

如何養成這種習慣:每周花一個小時(或盡可能多的時間),然后嘗試新技術。閱讀博客文章,找出哪些技術是相關的,然后選擇幾個你想添加到堆棧中的技術。然后,創建一些個人項目,來學習如何充分利用新技術。

適當維護文檔

我似乎總是很幸運能夠閱讀和處理具有糟糕文檔的代碼,而沒有支持注釋來幫助我了解到底發生了什么。

直到一天,我意識到這只是一個糟糕的程序員的標志。

我所遇到的的所有優秀程序員都提供清晰,簡潔的文檔,并通過提供有用的注釋來描述某些代碼行的用途。對于使用復雜算法和機器學習模型來解決問題的數據科學家而言,這一點尤為重要。

如何養成這種習慣:花一些時間閱讀有良好的代碼文檔或有關如何編寫良好的代碼文檔的文章。要練習,為舊的個人項目寫文檔,或者花一些時間來修改當前項目的文檔。

由于數據科學世界中有很大一部分都運行在Python上,請閱讀這篇關于如何記錄Python代碼的好文章:

https://realpython.com/documenting-python-code/

融入到數據科學的社群

人們曾經認為開發人員是不能融入社會的流浪者,他們束手無策的編寫注定要統治世界的代碼。這是一種過時的概括。它無法反映整個技術行業的現代復雜性。

“沒有人是一個小島。” ——最受數據科學家喜愛的名言

數據科學的復雜性要求在數據科學界內外建立一個龐大的專業人員支持網絡,來解決數據科學家必不可少的各種問題。

但是,社區的重要性不僅限于專業層面。隨著數據科學領域的不斷擴大,我們有必要為未來的分析師和工程師鋪平道路,以便他們也可以發揮影響并進一步支持其他數據科學家。

隨著數據科學領域的“性別”逐漸減少,進行必要更改的唯一方法是發起整個社區的運動,以激勵行業進行更好的變革。

如何養成這種習慣:成為一名導師,撰寫內容豐富的博客文章,加入數據科學論壇并幫助回答問題,建立一個YouTube頻道來分享你的經驗,參加Kaggle競賽和黑客馬拉松或創建課程來幫助未來的數據科學家學習他們需要進入這個行業的技能。

定期重構你的代碼

重構是清理代碼而不更改其原始功能的過程。雖然重構是軟件開發環境中必然產生的過程,但是重構對于數據科學家來說可能是一個有用的習慣。

重構時我的口頭禪是“少即是多”。

我發現,當我最初編寫解決數據科學問題的代碼時,我通常會拋棄良好的編碼習慣,而編寫在需要時可用的代碼。換句話說,我寫了很多沒有結構的代碼。然后,在獲得解決方案后,我重新清理代碼。

如何養成這種習慣:看一下舊代碼,想一想是否可以更高效地編寫相同的代碼。如果是這樣,請花一些時間來學習最佳編碼實踐,找出可以縮短,優化和闡明代碼的方法。

看一下這篇很棒的文章,它概述了代碼重構的最佳實踐:

https://www.altexsoft.com/blog/engineering/code-refactoring-best-practices-when-and-when-not-to-do-it/

優化你的工作區,工具和工作流程

現在有許多用可提高IDE效率的擴展,吃驚的是,有些人還沒有選擇優化其工作流程。

這種習慣對于每個人來說都是如此獨特,以至于真正要確定哪些工具,工作空間和工作流程使你成為可能的最有效和最高效的數據科學家。

如何養成這種習慣:每年一次(如果更適合你,則每年一次),評估你的整體有效性和效率,并確定可以改進的地方。也許這意味著早上要首先研究機器學習算法,或者坐在健身球上而不是椅子上,或者在IDE中添加一個新擴展名,從而為你的代碼添色。嘗試使用不同的工作空間,工具和工作流程,直到輸入最佳表單為止。

專注于理解商業問題

據我所知,在數據科學界,75%的工作是理解商業問題,25%的工作是編寫模型來解決問題。

編程,算法和數學是簡單的部分。了解如何實施它們來解決特定的商業問題,卻不是那么容易。花費更多的時間來理解業務問題和你要解決的目標,過程的其他部分將更容液。

要了解你所從事的行業所面臨的問題,你需要進行一些調查,來收集一些背景信息,去充實你在這個方面的知識。例如,你需要了解是什么使特定業務的客戶產生興趣,或者一個工程公司試圖達到什么目標。

如何養成這種習慣:花一些時間研究你正在工作的公司及其所從事的行業。編寫一份可以參考的備忘單,包括公司的主要目標和在這個特定行業的問題。別忘了寫下你可能要用來解決業務問題的算法或有關機器學習模型的,這些算法將來可能會有用。每當你發現有用的內容時,請將其添加到這個備忘單中。

采用簡約風格

不,不是生活。是在在你的代碼和工作流程中。

經常有人爭辯說,最好的數據科學家使用最少的代碼,最少的數據和最簡單的算法來完成工作。

盡管提倡極簡主義,我不希望你認為是不充足的。通常,當人們討論代碼中的極簡主義的重要性時,會有人嘗試開發僅使用幾行代碼的離譜解決方案。不要那么做。是的,這種代碼可以給人留下深刻的印象。但這真的是你最好地利用時間的方式嗎?

相反,一旦你熟悉了數據科學的概念,就可以開始尋找可以優化的代碼來將其變得簡單,簡潔和簡短。使用簡單的算法來完成工作,并且別忘了編寫可重用的函數來消除冗余。

如何養成這種習慣:當你逐漸在數據科學領域獲得進步時,開始敦促自己編寫更有效的解決方案,寫更少的代碼,并使用更簡單的算法和模型來完成工作。學習如何在不降低代碼有效性的情況下縮短代碼,并留下大量注釋來解釋合同約定版本的代碼。

使用功能消除復雜性和冗余

我首先要承認在我第一次寫數據分析代碼時嚴重忽略了函數的方法。當我難以通過各種分析來推理自己的方式時,Spaghetti代碼充滿了我的IDE。如果你查看我的代碼,你會認為我寫的太差了,你會想刪除它。

一旦我湊合得到了一個不錯的結果,我會回去嘗試修復這個相當于嚴重事故的代碼。通過將代碼做成函數,我可以快速消除不必要的代碼的復雜性和冗余。如果我只對代碼重新編譯,我已經將其簡化到當我重新閱讀它時我理解我是如何做到的。

如何養成這種習慣:在寫代碼時請不要忘記函數的重要性。人們經常說,最好的開發人員是懶惰的開發人員,因為他們會找出如何創建不需要很多工作的解決方案。在你寫出解決方案后,請重新將多余或復雜的代碼寫成函數,以幫助組織和簡化代碼。

應用測試驅動的開發方法

測試驅動開發(TDD)是一種軟件開發原理,專注于編寫具有不斷測試的增量改進的代碼。TDD在“紅色,綠色,重構”系統上運行,該系統鼓勵開發人員構建測試套件,編寫實現代碼,然后優化代碼庫。

數據科學家可以成功使用TDD,來構建分析pipeline,進行概念證明,使用數據子集并確保在開發過程中不會破壞功能代碼。

如何養成這種習慣:學習TDD的知識,并考慮是否可以在你的工作流中使用這個原理, TDD并不是針對每個問題的完美答案,但如果嚴謹的使用, TDD可能會很有用。

這篇文章對TDD進行了很好的描述,并提供了有關如何將其實現到數據科學項目中的示例:

https://towardsdatascience.com/tdd-datascience-689c98492fcc

進行少量頻繁的提交

你是否經歷過提出pull request,計算機上出現了錯誤消息而且使你的計算機崩潰了嗎?我有。那感覺糟透了。

在你想痛擊那個做出這個提交的人時,喘口氣,并記住,這個人顯然沒有花時間去養成良好的習慣。

團隊合作的軟件開發的黃金法則是什么?進行少量頻繁的提交。

如何養成這種習慣:經常練習提交代碼更改,并定期做出請求來獲取最新的代碼。你或他人所做的每項更改都可能破壞整個項目,因此,進行易于恢復且可能僅影響項目一部分或一部分的小更改很重要。

優先發展自我

取決于你詢問的人,這個行業有過多或過少的數據科學家。

無論行業是處于飽和還是干旱狀態,你都將與大量高素質且常常是過高素質的求職者競爭。這意味著在申請工作之前,你需要已經養成自我提高的習慣。如今,每個人都因為合理的原因在提高自身技能,這一趨勢對數據科學家來說也不例外。

如何養成這種習慣:列出技能清單,看看你如何滿足雇主在工作崗位上的要求。你是否能有效使用相關庫(例如Keras,NumPy,Pandas,PyTorch,TensorFlow,Matplotlib,Seaborn和Plotly)的Pythonista嗎?你能否寫一份備忘錄來詳細說明你的最新發現以及它們如何將你的公司的效率提高25%?你是否愿意作為團隊的一部分來完成一個項目?你要試圖找出你的不足之處,而且找到一些好的的在線課程或資源來增強你的技能。

在開始一個項目時你要知道項目的期望結果是什么

Stephen Covey在高效能人才的7個習慣中討論了“從始至終”的原則。

為了有效地將其與數據科學項目聯系起來,您需要在項目的規劃階段問自己,這個項目的期望結果是什么。這將有助于你了解項目的整體結構,并提供實現目標所需的成果的路線圖。不僅如此,確定項目的結果將使您對整個項目的可行性和可持續性有所了解。

如何養成這種習慣:在每個項目開始時都要進行一個計劃會議來準確地列出了你希望在項目結束時實現的目標。確定要嘗試解決的問題,或要收集的證據。然后,你可以開始回答可行性和可持續性問題。這些問題將影響項目的里程碑和結果。之后,你可以使用制定清晰的計劃,來輔助你編寫代碼和機器學習模型來完成項目。

理解,然后你能被理解

當理查德·費曼不能夠成功的解釋給大學新生新生自旋V2粒子服從的原理時,他說道:“我想我可以有把握地說,沒有人真正理解量子力學。”費曼被稱為“偉大的解釋者”,他留下了數據科學家只能希望效仿的遺產。

數據科學是一種使用數據講述一個引人入勝的故事的藝術,只有當講故事的人理解了他們試圖講的故事后,它才能成功。換句話說,理解你的任務才能使你能夠被理解。在了解你要完成的任務時盡早養成這種習慣,這樣你就可以與其他人以相當的理解水平分享它,這將使你成為會議室中最有效的數據科學家。

如何養成這種習慣:使用費曼技術來加深對要嘗試發現的概念以及要解決的問題的理解。此方法非常適合于分析數據然后向一般非數據科學利益相關者解釋結果的數據科學過程。簡而言之,你可以將對主題的解釋精簡到可以用任何人都可以理解的簡單,非專業術語解釋的程度。

閱讀研究文獻

在這個由研究生和博士主導的領域,行業的新聞和見解通常由發表的文獻分享。

研究文獻是了解他人如何解決問題,擴大我們的視野以及了解最新趨勢的有效方法。

如何養成這種習慣:每周選擇一篇或兩篇與你當前的工作或對追求或研究感興趣的技術有關的文獻。盡量為每周的文獻閱讀留出時間,并將其作為優先事項。熟悉閱讀論文的Three Pass 方法來幫助你快速收集相關信息。要真正鞏固你對論文的理解,請嘗試將你從閱讀中學到的東西應用到你的項目中或者與同事分享你學到的東西。

樂于改變

從使用的技術到實現的目標,數據科學的世界正在迅速變化。不要成為那些束手無策,不愿改變的數據科學家。

樂于接受變革,這不僅會迫使你不斷提高專業水平,而且還使你在瞬息萬變的行業中保持重要地位,一旦你落后,該行業將使你脫穎而出。

如何養成這種習慣:每當有新技術或新方法發布新聞時,你可以嘗試一下,看看新技術或新方法帶來了什么。即使你只是閱讀文檔,也可以隨時了解該行業不斷變化的趨勢。此外,你可以將有關技術的觀點帶入你的公司,并幫助他們應對技術變化和進步。作為一個對實時新技術敏感的人,你將會一直處于領先位置,也可以指導你的團隊和公司尋求更好,更有效的解決方案。

在數據科學職業的任何階段,養成良好的習慣可以發展你成為團隊高效成員的潛力,你將會對任何需要解決的問題做出重大影響。

沒有比現在更好的時間為未來的成功做好準備。

相關報道:

https://towardsdatascience.com/15-habits-i-stole-from-highly-effective-data-scientists-441b1d46c572?source=extreme_main_feed---------37-73--------------------2305a9c9_2b59_44a4_8f7f_b7036d51f7f0-------

【本文是51CTO專欄機構大數據文摘的原創譯文,微信公眾號“大數據文摘( id: BigDataDigest)”】

戳這里,看該作者更多好文 

 

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2017-08-04 15:53:10

大數據真偽數據科學家

2017-04-12 09:34:30

數據科學家統計學家好習慣

2012-12-06 15:36:55

CIO

2018-11-19 06:00:32

數據科學家數據科學

2018-12-24 08:37:44

數據科學家數據模型

2012-12-26 10:51:20

數據科學家

2018-02-28 15:03:03

數據科學家數據分析職業

2016-03-10 13:56:42

數據科學數據科學家數據分析

2015-08-25 13:20:29

數據科學

2016-04-11 14:15:06

數據科學數據挖掘工具

2020-03-20 14:40:48

數據科學Python學習

2012-06-12 09:33:59

2018-10-16 14:37:34

數據科學家數據分析數據科學

2018-10-18 09:00:00

機器學習機器學習算法數據科學家

2018-03-01 15:34:20

數據科學面試招聘

2017-01-23 16:00:25

數據科學家大數據數學家

2018-12-06 13:08:30

數據科學家大數據數據科學

2019-12-04 15:02:22

數據科學家故事數據分析

2019-07-05 10:29:17

大數據數據科學家

2016-05-11 10:36:16

數據科學家數據科學大數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 在线黄色网 | 精品在线观看一区二区 | 精品久久久久久久 | 欧美另类视频在线 | 在线免费观看成年人视频 | 久久一二 | 中文字幕av一区二区三区 | 中文字幕一区二区三区日韩精品 | 福利电影在线 | 色综合天天综合网国产成人网 | 性一交一乱一透一a级 | 一二三四在线视频观看社区 | 国产一区久久精品 | 国产精品久久久久久久久久久久冷 | 久久久久久久一级 | 久久99成人 | 亚洲综合中文字幕在线观看 | 成人在线视频一区二区三区 | 亚洲av毛片 | 伊大人久久 | 国产亚洲成av人片在线观看桃 | 精品国产一区二区三区性色av | 一区二区免费 | 亚洲aⅴ | 夜夜草| 亚洲一区二区中文字幕 | 亚洲欧美一区二区三区视频 | 欧美精品久久久久 | 成人婷婷 | 久久久久99 | 欧美日韩国产精品 | 欧美一卡二卡在线观看 | 亚洲在线久久 | 国产日屁 | 夜夜夜夜夜夜曰天天天 | 色秀网站 | 亚洲精品在线视频 | 毛片免费看 | 777zyz色资源站在线观看 | 国产免费一区 | 亚洲国产免费 |