不要上手就學深度學習!超詳細的人工智能專家路線圖,GitHub數(shù)天獲2.1k星
這 個學習路線圖幾乎涵蓋了人工智能領域的所有內(nèi)容,點點鼠標,就能鏈接所需知識。
想從事人工智能領域的研究,盲目地在網(wǎng)上購買了一本又一本的參考資料,學習視頻刷了一遍又一遍…… 反過頭來看,這些方法可能作用并不是很大,卻消耗了大量的時間和金錢。
這時,一種提綱式的學習途徑就顯得尤為重要了。如果你想成為數(shù)據(jù)科學家、機器學習或者 AI 專家,而又苦于找不到合適的學習方法,本文將提供一組思路清晰、簡單易懂的人工智能專家路線圖。
這是一家德國軟件公司 AMAI GmbH 近期發(fā)布的 GitHub 項目——AI 專家路線圖(AI-Expert-Roadmap)。該路線圖幾乎涵蓋了 AI 領域所有的知識點,并且每個知識點都有詳細的文檔。有了這個路線圖的指導,或許能幫助你快速入門乃至成為 AI 領域的佼佼者。該項目上線短短幾天,已經(jīng)收獲了 2.1k 星。
項目地址:https://github.com/AMAI-GmbH/AI-Expert-Roadmap
亮點多多的 AI 專家路線圖
對學習者非常友好的是,這份 AI 專家路線圖是一個互動版本。 每個子模塊所列內(nèi)容都可以鏈接到指定網(wǎng)站,學習者可以找到詞條的維基百科或其他來源的釋義和拓展內(nèi)容。 此外,如果有新的研究出現(xiàn)時,該路線圖會隨時更新。
該路線圖旨在給學習者提供關于人工智能的整體概念,并在學習感到困惑時給予指導,而沒有鼓勵學習者一味地選擇最先進、最熱門的技術。這是因為在科研中,每個人都需要了解哪種工具最適合自己。換言之,最先進、最熱門的技術不一定是最適合的。
就這份 AI 專家路線圖而言,開發(fā)者列出了任何學習路徑所必不可少的一些要素,如論文和代碼、版本控制、語義化版本控制和更新日志。但就具體選擇上,開發(fā)者認為在學習 AI 時不應直接過渡到當前熱門的技術——深度學習,而應步步為營,并提供了 3 條可供選擇的學習路徑:數(shù)據(jù)科學家→機器學習→深度學習…;數(shù)據(jù)科學家→數(shù)據(jù)工程師…;大數(shù)據(jù)工程師→…
循序漸進才是「王道」。
AI 專家路線圖概覽
這部分內(nèi)容簡要總結了 AI 專家路線圖,并從以下幾個方面著手講解: 數(shù)據(jù)科學家、機器學習、深度學習、數(shù)據(jù)工程師以及大數(shù)據(jù)工程師 。這 5 部分內(nèi)容都有詳細的學習路線圖,點擊圖表任意模塊,都會鏈接到對應的內(nèi)容。
數(shù)據(jù)科學家路線圖
在數(shù)據(jù)科學家路線圖中,我們可以了解到進行 AI 研究所需要的基礎:矩陣和線性代數(shù)、數(shù)據(jù)庫、表格數(shù)據(jù)、數(shù)據(jù)格式(JSON、XML、CSV)、正則表達式等等。
在統(tǒng)計學方面,該路線圖涵蓋了概率論、概率分布、估計、假設檢驗、置信區(qū)間、大數(shù)定律、蒙特卡羅方法等等。
在 Python 編程方面,該路線圖展示了 Python 基礎、比較重要的 Python 庫以及所需運行環(huán)境等。
在數(shù)據(jù)來源方面,學習者點擊「Awesome Public Datasets」圖標,就可以鏈接到整理好的公共數(shù)據(jù)集等。接著過渡到可視化和探索性數(shù)據(jù)分析 / 轉(zhuǎn)換 / 整理相關內(nèi)容,最后進入到機器學習和數(shù)據(jù)工程師兩個不同的方向。
機器學習路線圖
機器學習路線圖主要分為 4 大部分: 基礎概念、算法、用例以及所用工具 。其中基礎概念部分主要包括機器學習中常用的概念、梯度下降、訓練集、測試集、驗證集等基礎概念;算法部分列舉了 4 類算法:監(jiān)督學習、無監(jiān)督學習、集成學習和強化學習;用例部分列舉了情感分析、協(xié)同過濾、標注和預測;所用工具部分則介紹了 scikit-learn、spacy 等工具。每部分內(nèi)容都有對應的詳細文檔。
深度學習路線圖
機器學習之后進入到了深度學習,這是第 1 條可選擇學習路徑的最后部分。深度學習路線圖由 4 大部分組成: 論文、神經(jīng)網(wǎng)絡、網(wǎng)絡架構以及所用工具 。論文部分提供了深度學習論文閱讀路線圖以及 SOTA 論文;神經(jīng)網(wǎng)絡部分提供了一篇詳細介紹如何理解神經(jīng)網(wǎng)絡的博客文章;網(wǎng)絡架構部分包括感知器、自動編碼器、CNN、RNN;所用工具部分主要介紹了 TensorFlow 、PyTorch 等。最后給出建議:保持探索、與時俱進。
數(shù)據(jù)工程師路線圖
在數(shù)據(jù)科學家路線圖之后可以直接進入到數(shù)據(jù)工程師路線圖,這是第 2 條可選擇的學習路徑。該路線圖主要介紹了數(shù)據(jù)格式、數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)集成、數(shù)據(jù)融合、數(shù)據(jù)調(diào)研、數(shù)據(jù)湖和數(shù)據(jù)倉庫以及如何使用 ETL 等多方面內(nèi)容。
大數(shù)據(jù)工程師路線圖
大數(shù)據(jù)工程師路線圖是第 3 條可選擇的學習路徑,主要分為 3 部分內(nèi)容: 大數(shù)據(jù)架構、遵循的原則以及所用工具 。大數(shù)據(jù)架構部分主要講述了大數(shù)據(jù)分析架構模式和最佳實踐;遵循的原則包括數(shù)據(jù)庫管理系統(tǒng)中的數(shù)據(jù)復制,以及 Hadoop 中 NameNode 和 DataNode 的區(qū)別等;所用工具則介紹了 Hadoop、Spark 等。