互聯網上20大免費數據科學、機器學習和人工智能慕課
在21世紀,傳統教育已經轉變為一種選擇,而不是人生中的必經階段。
隨著互聯網的繁榮和大規模網絡公開課(mooc慕課)的興起,人們可以選擇在線學習數據科學,以避免學生的債務負擔。
統計數據顯示,線上教學使學生在每小時的訓練中可以多學習5倍的材料。在線學習的好處是無限的,包括降低成本和靈活的時間安排和環境。
數據科學的民主化
現在是2020年,數據科學比以往更加民主化。這意味著任何個人只要有適當的工具和大量的數據,就可以在幾乎沒有專業知識的情況下進行數據科學研究。隨著數據滲透到整個行業的每一個角落,擁有數據科學家的技能是大勢所趨,也因此產生了一支會說數據語言的員工隊伍。
考慮到這一點,通過在線課程,對于一個完全的初學者來說,開始研究數據科學是可能的。所需要的只是一個結構合理的學習課程、正確的學習方法、堅持不懈的動力和激情以及輔助訓練項目。
如何線上學習數據科學?
最好的慕課 + 正確的學習方法 + 激情 + 項目
所以在這篇文章中,我將介紹最好的慕課,它們是免費的,對于想成為數據科學家的人是非常有價值的。
數據科學韋恩圖

Drew Conway
數據科學的多學科交叉性可以通過德魯 · 康威這張飽受嫌棄的維恩圖可視化。通過這個圖表,我們可以推斷出數據科學領域包括黑客技能、機器學習和多重變量分析。
我已經排除了領域專業知識,因為這取決于你所在的公司,而在線課程無法獲得溝通技能等硬技能,你需要與現實生活中的人交談才能做到這一點(盡管這可能令人畏縮)。
以下20個課程將分為3個部分:
1. 數據科學
2. 黑客技能
- Python
- R語言
- 結構化查詢語言
3. 機器學習與人工智能
- 機器學習與人工智能基礎
- 深度學習
- 自然語言處理
- 計算機視覺
我沒有實地考察不同課程,也沒有花幾個小時過濾網上的干擾信息,而是編輯了這個列表,其中包含了我發現在機器學習、人工智能、數據科學和編程學習中很有用的課程。
下面,就來看看這個列表吧!
慕課
0. 學會如何學習
這門課程能教你的人生中最重要的技能之一,就是學會如何學習。它會教你一些技巧和方法,確保你能記住你所學到的東西,并幫助你在現實生活中應用它們。因為擁有正確的學習方法是學習任何東西的一個重要先決條件,這就是為什么它被列為序號0,因為它為下面的每一門課程奠定了基礎。
數據科學
1.CS109數據科學——哈佛
CS109是介紹調查的五個關鍵方面的課程:
- 數據糾纏、清理和取樣,以獲得合適的數據集
- 數據管理能夠快速、可靠地訪問大數據
- 產生假設和直覺的探索性數據分析
- 基于回歸和分類等統計方法的預測
- 通過可視化、故事和可解釋的摘要來交流結果。
另外,它是用Python教的!
2. 從數據中學習——加州理工
對于所有數據愛好者來說,深刻理解機器如何從數據中學習以及如何改進處理過程是至關重要的。這是一門介紹機器學習的課程,包括基本理論,算法和應用。
你將學到什么:
- 學習是什么?
- 機器能學習嗎?
- 如何做到?
- 如何做好?
3. 大數據概論——加州大學圣地亞哥分校
現在是大數據時代,所有的數據科學愛好者都有義務去了解大數據是什么以及它為什么重要。
你將學到什么:
- 大數據問題、應用程序和系統背后的術語和核心概念。
- 大數據在個人的業務或職業生涯中有多大用處。
- 介紹最常用的框架之一 Hadoop
4.數據科學——約翰·霍普金斯大學(JHU)
簡而言之,本課程教你如何提出正確的問題,操作數據集,以及創建可視化來交流結果。
你將學到什么:
- 使用R語言來清理、分析和可視化數據。
- 從數據采集到發布,瀏覽整個數據科學管道。
- 使用GitHub管理數據科學項目。
- 使用回歸模型執行回歸分析、最小二乘和推斷。
最后,你將擁有一個頂點項目,在這個項目中,通過應用真實世界的數據構建一個實際產品,并有所學習。然后,這個作品將描繪你新獲得的數據科學實力。
數學
5. 機器學習專業化的數學——倫敦帝國理工學院
這門課程是機器學習的數學專業,它涵蓋了你需要的所有數學知識,幫助更新你在學校可能已經忘記的所有概念和理論。最重要的是,這門課程教你計算機科學的應用,讓你對矩陣和回歸與機器學習和數據科學的關系有更直觀的認識。
這一專業分為三個主要課程:
- 線性代數
- 多元微積分
- 降維主成分分析
在這個專業的最后,你將獲得必要的數學知識以繼續你的旅程,并采取更高級的課程在機器學習。
6. 線性代數——麻省理工
由獨一無二的吉爾伯特·斯特朗教授授課。斯特朗先生是最好的線性代數講師(個人認為)。因此,如果你正在尋找一個好的線性代數課程,那就是它了。
本課程涵蓋矩陣理論和線性代數,強調在其他學科有用的主題。
7. 多元微積分——麻省理工
多元微積分是數據科學中的另一個重要概念。從簡單線性回歸到支持向量機,以及神經網絡,微積分都是必要的。
本課程涵蓋多元函數的微分、積分及向量微積分。
8.概率與統計——斯坦福大學
概率和統計是數據科學中所有奇跡發生的基礎。如果沒有p值分布和二項分布以及所有行話,用數據進行預測將是不可能的。
你將學到什么:
- 探索性數據分析
- 產生數據
- 概率
- 推論(Inference)
遺憾的是,這個課程已經結束了,所以下面是一個復習課程!或者如果你想要卡內基梅隆大學的類似課程,請點擊這里。
黑客技能
9. 谷歌Python課程
谷歌為初學者設計的免費課程。本課程主要由筆記、視頻和大量的代碼練習組成,幫助您開始用Python寫代碼。我發現它很有用,并向所有希望開始學習Python的人推薦它。
10.應用數據科學與Python——密歇根大學
密歇根大學的5門專業課程,通過Python編程語言向學習者介紹數據科學。本課程使用方便、直觀的木星筆記本(JupyterNotebooks)。
這五門課程是:
- 數據科學導論
- 應用繪圖、制圖和數據表示
- 應用機器學習
- 應用文本挖掘
- 應用社交網絡分析
11. R語言統計學——杜克大學
這種專業化幫助您掌握R語言中的分析和可視化,R語言是數據科學領域中頂尖的編程語言之一。
你將學到什么:
- 創建可重復的數據分析報告
- 推論統計的統一性
- 執行頻率推論統計和貝葉斯模型,以了解自然現象和作出基于數據的決定
- 在不依賴統計術語的情況下,正確、有效地傳達統計結果,批評以數據為基礎的要求和評價以數據為基礎的決定
- 用R語言包為數據分析爭論和可視化數據。
12.數據科學中的結構化查詢語言——加州戴維斯大學
結構化查詢語言(SQL)是數據科學家檢索和處理數據的重要工具,是與數據庫系統交互的公認語言。這個課程是為那些想要在領英(職場社交平臺)技能部分中添加SQL,并開始使用它來挖掘數據的初學者量身定做的。最重要的是,他們將學會提出正確的問題,并得出好的答案,為你的組織提供有價值的見解。
你將學到什么:
- 創建表格,并能夠將數據移入表格
- 常用操作符和如何組合數據
- 案例語句、數據治理和概要分析等概念
- 討論有關數據的話題,并利用現實世界的編程作業進行練習
- 解釋源數據中的結構、含義和關系,并將 SQL 作為一種專業數據來塑造數據,以便進行目標分析
機器學習和人工智能
13.機器學習速成班——谷歌
這個速成課程是一個為有抱負的機器學習實踐者準備的自學指南,它以視頻講座、現實世界的案例研究和實踐練習為特色。這是在“與谷歌學習”人工智能倡議下的課程之一,鼓勵所有人學習人工智能。
14.人工智能要素——赫爾辛基大學
《人工智能要素》是由Reaktor和赫爾辛基大學開發的一系列免費在線課程。它旨在鼓勵每個人學習人工智能是什么,人工智能能做什么和不能做什么,以及如何開始創造人工智能途徑。這些課程結合了理論和實踐練習,可以按自己的步調完成。
15.機器學習——吳恩達
吳恩達的機器學習是互聯網上最受歡迎的在線課程之一,它包含方方面面。從最基礎的到神經網絡和支持向量機,最后加上一個應用項目。這門課程的好處是吳恩達是一位令人難以置信的老師。壞的方面,是用MATLAB教的(我更喜歡 Python)。
16.程序員的實用深度學習課程——Fast.ai
如果你想免費了解深度學習,Fast.ai是一個在線課程。互聯網上的每個人都推薦它,對于那些想要學習深度學習的人來說,它無疑是一個有價值的資源。本課程利用jupytorch的筆記本進行學習,并將其作為編寫深度學習代碼的主要工具。
17. 深度學習——斯坦福大學
深度學習是人工智能中最受歡迎的技能之一。在本課程中,你將學習深度學習的基礎,了解如何建立神經網絡,并學習如何領導成功的機器學習項目。您將學習卷積網絡、RNNs、LSTM、Adam、Dropout、BatchNorm、Xavier/He初始化等等。
18. CS224N 自然語言處理與深度學習——斯坦福大學
自然語言處理(NLP)是信息時代的重要技術之一,是數據科學的重要組成部分。NLP的應用無處不在——在網絡搜索、電子郵件、語言翻譯、聊天機器人等領域。在本課程中,學生將獲得有關自然語言處理的深度學習的前沿研究的全面介紹。
你將學到什么:
- 設計、實現和理解你的神經網絡模型。
- PyTorch!
19. CS231n: 用于視覺識別的卷積神經網絡——斯坦福大學
計算機視覺已經在我們的社會中無處不在,其應用領域包括搜索、面部識別、無人機,最引人注目的是特斯拉汽車。本課程深入探討深度學習架構的細節,重點是學習這些任務的端到端模型,特別是圖像分類。
你將學到什么:
- 實施、訓練和調試他們的神經網絡
- 詳細了解計算機視覺的前沿研究。
最后的任務包括訓練一個數百萬參數的卷積神經網絡,并將其應用于最大的圖像分類數據集(ImageNet)。
榮譽提名
- 可汗學院
- Kaggle課程
- 線性代數、微積分和神經網絡的藍色布朗本質
- 邁向數據科學學習部分
行動計劃
在線學習數據科學有時很困難,因為你沒有一個結構化的課程來告訴你該做什么。但是,與其這樣看待它,不如意識到你有自由去構建一條適合自己的學習道路,并且可以讓自己發揮出最好的一面。一個好處是,你可以在你的大腦處于最高效率的時候學習,在它效率較低的時候休息。此外,你可以根據自己的興趣和熱情來決定學習什么。
建議
在網上學習的時候,一些小竅門就是保持做簡單的筆記,在一天結束的時候寫一些心得,或者在博客上記錄你所學到的東西。同樣,利用費曼技術向朋友和家人解釋你所學到的東西也很重要,尤其是對于像數據科學這樣的復雜課題。
此外,學習機器學習算法和神經網絡時,在編寫代碼的同時學習它是至關重要的,這樣你就可以看到你在學習什么,并對手頭的主題有更好的理解。成為諸如Reddit,Discord等在線社區的一部分也是很好的,這樣你就可以提出問題并從專家那里得到很好的答案。
總結一下:
- 記筆記/寫博客
- 使用費曼技巧
- 編碼和概念(從頭開始創建一個神經網絡)
- 加入數據科學在線社區提問
最后,引用阿瑟 · w · 奇克林和斯蒂芬 · c · 埃爾曼的一句話
“僅僅坐在課堂上聽老師講課、記憶預先包裝好的作業、吐出答案,學生學不了多少東西。他們必須談論正在學習的東西,寫下關于它的反思,將它與過去的經歷聯系起來,并將它應用到日常生活中。他們必須讓學到的東西成為自己的一部分。”
感謝閱讀,希望這篇文章對你來說能提供很多思路的。
51CTO學院課程推薦:深度學習工程師實戰系列(必備原理+主流框架+項目實戰)