18個值得推薦的學習Python和SQL的數據科學平臺
數據科學是當今市場上最熱門的職業之一。 公司一直在聘用數據科學家,并且總是有很多人試圖成為一名科學家。 但是,數據科學的發展不及其他技術學科那么長,因此與軟件開發不同的是,沒有專門針對數據科學的學習平臺來幫助有抱負和經驗豐富的科學家培養。 當然有Coursera和Udemy,然后是一些知名品牌平臺,例如DataCamp。 然后有十二個或更多個較小的利基平臺,旨在以自己的方式培訓數據科學家。
我評估了數據科學界人士推薦的18種平臺。 根據您的學習風格和需求,這里有一個平臺。 本文的前半部分是我對平臺的最終評估,最后是平臺的完整列表以及所有有助于評估它們的細節。 本文的下半部分詳細介紹了我評估平臺的方法-了解不同的用戶類型,采購平臺和要評估的變量。 因此,如果您有時間,請先跳到最后以了解我的評估標準,然后閱讀結果。 如果時間緊迫,請轉到下一部分。
TL; DR:我的評估
我創建了2個圖來映射變量。 它們是帶有您在所有白皮書中看到的象限的那些圖。 老實說,我為選擇這種可視化感到有些ham愧(感覺就像在Excel中制作3D餅圖),但是我認為它將使您快速確定最適合您的平臺。
圖1:學習風格和經驗
問自己:我的學習方式是什么? 我想直接潛水并開始編碼嗎?還是想先觀看視頻? 我是這方面的新手,需要更多幫助嗎? 還是我可以直接跳進去?
> Learning style by user experience [Image created by N. Rosidi]
在基于演講的平臺的最末端是純粹的被動演講,例如網頁上的文字或視頻交談的人。 這些平臺通常會要求您自己安裝軟件,我認為這很懶,因為使用所有軟件啟動服務器非常容易,以提供完整的現成體驗。 用戶并不總是很先進-這就是他們要學習的原因-因此至少必須對我來說,為他們提供一種可以通過瀏覽器輕松訪問的軟件,庫和數據集的體驗。
互動式,自主學習使您可以按照自己的節奏工作,并選擇想要學習或練習的主題。 在最末端,有一個功能齊全的IDE,可讓您像在真正的專業環境中一樣瀏覽,交互和操作數據。 但這不僅是完全自我指導的,還提供了可以幫助您解決問題和理解概念的解決方案。 這里的方法是立即開始編碼,并在遇到問題時學習解決方案。 這些平臺非常適合經驗豐富的用戶,即使您只是中等程度的經驗。
中間立場是講課和互動式自主學習的結合。 使用這些平臺,您將走上一條"路線"和"道路",從頭到尾學習一系列概念。 系統會向您顯示文本和/或視頻,然后要求您在交互式但受限的IDE中應用所學到的知識,在IDE中,系統會向您詢問復雜的問題。 交互式但受限的IDE意味著IDE僅接受回答提示問題的輸入,因此您不能偏離道路探索數據或嘗試不同的功能和技術-知道,一位出色的數據科學家會做的事情。 這對于從頭開始學習并試圖從頭開始學習新東西的人來說是完美的。
圖2:內容重點
問問自己:我在嘗試學習python嗎? 還是我想學習python成為數據科學家? 我要準備面試嗎? 還是我正在嘗試建立我的第一個機器學習模型? 還是只是嘗試學習基礎知識?
> Educational topics by technical focus [Image created by N. Rosidi]
專業主題是針對特定目的的教育內容。 例如,它準備進行技術面試(數據科學或軟件開發)。 這是要學習使用python進行財務建模或構建梯度增強的決策樹。 這些平臺服務于小眾群體,但它們在滿足用戶群方面做得非常好。
通識教育只是對基本概念的介紹,這些基本概念是熟練掌握該語言的基礎,例如如何創建熊貓數據框來操縱數據。 掌握了這些概念后,下一階段將是深入研究滿足您需求的特定主題。
設計平臺時要考慮到用戶。 在這種情況下,您是數據科學家還是軟件開發人員? 如果您正在閱讀本文,則可能是數據科學家,但正如我之前提到的,還有更多的教學平臺可用于教授軟件開發。 有時,這些平臺提供python教育,但它們的內容和示例并不總是適合數據科學家使用。 這有點像將插件添加到軟件中(它不是本機的,有時會顯得有些笨拙)。
每個平臺的詳細評估
萬一圖表還不夠用。
每個平臺的知名度和獨特性
> Link to the Google Sheet: https://bit.ly/2UknbZ3
哪種類型的用戶將從每個平臺中受益最多
> Link to the Google Sheet: https://bit.ly/2YaNlhR
根據用戶體驗水平的教學風格和功能
> Link to the Google Sheet: https://bit.ly/3f0SPm9
按技術重點列出的教育主題(數據科學和軟件開發)
> Link to the Google Sheet: https://bit.ly/30kaqkS
因此,根據您的職業目標和學習方式,每個人都有一個平臺。 在旅途中,您可能最終會使用其中一些平臺,因為每個平臺都專注于特定的優勢。 選擇一個數據科學平臺,該平臺可讓您了解所處階段所需要學習的知識。 希望這份清單對您有所幫助。
請參閱下面的我評估平臺的方法…
附錄:我評估18個平臺的方法
1. 用戶角色
我從了解用戶-您開始。 在考慮哪種類型的人會對學習數據科學感興趣時,我想出了3種不同的用戶角色:
- 經驗豐富的數據科學家:這些是當前的數據科學家。 他們要么擁有多年的經驗和經驗豐富,要么就職于公司,或者他們在第一份工作中是數據科學家。 無論哪種方式,這些家伙都在尋找新工作并且需要準備/補充他們的面試技能,或者想學習其他數據科學技能以進入另一門數據科學領域。
- 技術性,經驗不足/有抱負的數據科學家:這些人可能是CS學生或當前的業務分析師。 他們編寫代碼,并且在開始提高數據科學技能時不需要太多的工作。 他們可能對數據科學的職業轉變感興趣。
- 非技術,缺乏經驗/有抱負的數據科學家:這些人可能是學生,也可能是公司中非技術人員。 他們不會編寫代碼,也不知道從哪里開始,但是他們對數據科學事業或將自己的腳趾插入技術世界感興趣。
2. 采購公司(包括和排除)
我問自己,有人將如何了解數據科學平臺。 除了簡單的Google搜索之外,大多數人會選擇他們認可的品牌,或者根據推薦選擇平臺。
我選擇從流行子索引的建議中找到平臺,例如:
- r /數據科學
- r /編程
- r / python
- R / SQL的
Reddit擁有活躍的數據科學社區,因此這是一個不錯的起點。 我補充了Quora,Google和Youtube。
我有意識地選擇排除(MOOC)大規模的在線公開課程(例如Udemy,EdX和Coursera),訓練營和大學課程,因為質量取決于教師和課程,因此我很難評估從蘋果到 蘋果。 另外,我認為經驗豐富的數據科學家實際上不會參加有關如何成為數據科學家的Udemy課程,但我可能是錯的。
對于每個平臺,我都注冊并使用了一段時間。 除非我無法根據自己的標準正確評估平臺,否則我不會注冊使用高級版本。
3. 我評估中使用的變量
我根據我認為對上述每個用戶角色都很重要的4個主要變量評估了每個平臺。

返回我的評估部分以閱讀結果!