入行數(shù)據(jù)科學(xué),這些書(shū)一定要看
大數(shù)據(jù)已經(jīng)成為這個(gè)時(shí)代的標(biāo)志,如何理解和運(yùn)用大數(shù)據(jù),也是我們這個(gè)時(shí)代的重中之重。因此選擇一本合適的數(shù)據(jù)科學(xué)書(shū)至關(guān)重要。

近日,在GitHub上看到一張大而全的數(shù)據(jù)科學(xué)書(shū)單圖,該圖片分成七大領(lǐng)域,各自都有相對(duì)應(yīng)的推薦書(shū)單,本文就為為各位推薦幾本書(shū),希望能夠有助于你在大數(shù)據(jù)方面的學(xué)習(xí)。
1、《數(shù)據(jù)科學(xué)入門(mén)》

本書(shū)從零開(kāi)始講解數(shù)據(jù)科學(xué)工作,教授數(shù)據(jù)科學(xué)工作所必需的黑客技能,并帶領(lǐng)讀者熟悉數(shù)據(jù)科學(xué)的核心知識(shí)——數(shù)學(xué)和統(tǒng)計(jì)學(xué)。作者選擇了功能強(qiáng)大、簡(jiǎn)單易學(xué)的Python語(yǔ)言環(huán)境,親手搭建工具和實(shí)現(xiàn)算法,并精心挑選了注釋良好、簡(jiǎn)潔易讀的實(shí)現(xiàn)范例。書(shū)中涵蓋的所有代碼和數(shù)據(jù)都可以在GitHub上下載。
2、《Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking》

本書(shū)清晰易懂,適合統(tǒng)計(jì)基礎(chǔ)一般的人用來(lái)先理解ML的概念,書(shū)中涵蓋大量數(shù)據(jù)科學(xué)的概念,讀起來(lái)通俗易懂。你可以把書(shū)中大框架都理解了再去看別的更偏重理論或算法的書(shū),
3、《貝葉斯思維》

這本書(shū)旨在幫助那些希望用數(shù)學(xué)工具解決實(shí)際問(wèn)題的人們,但閱讀本書(shū)之前你***懂一點(diǎn)概率知識(shí)和程序設(shè)計(jì)。本書(shū)在共計(jì)15章的篇幅中討論了怎樣解決十幾個(gè)現(xiàn)實(shí)生活中的實(shí)際問(wèn)題。在解決問(wèn)題的過(guò)程中,作者還潛移默化的幫助讀者形成了建模決策的方法論,在這個(gè)意義上,這本書(shū)又是一本關(guān)于數(shù)學(xué)建模的成功樣本。
4、《數(shù)據(jù)科學(xué)實(shí)戰(zhàn)》

這本書(shū)涉及的面包含數(shù)據(jù)科學(xué)的各個(gè)層面,是相關(guān)專(zhuān)家客座課堂講義的分析和總結(jié),主要涵蓋以下內(nèi)容:
- 統(tǒng)計(jì)推斷、探索性數(shù)據(jù)分析(EDA)及數(shù)據(jù)科學(xué)工作流程
- 算法
- 垃圾郵件過(guò)濾、樸素貝葉斯和數(shù)據(jù)清理
- 邏輯回歸
- 金融建模
- 推薦引擎和因果關(guān)系
- 數(shù)據(jù)可視化
- 社交網(wǎng)絡(luò)與數(shù)據(jù)新聞
- 數(shù)據(jù)工程、MapReduce、Pregel和Hadoop
5、《復(fù)雜性思考》

本書(shū)提供了一系列練習(xí);這些練習(xí)都要求學(xué)生重新實(shí)現(xiàn)一些開(kāi)創(chuàng)性實(shí)驗(yàn)并對(duì)其進(jìn)行擴(kuò)展。復(fù)雜性吸引人的一個(gè)地方在于我們可以通過(guò)適當(dāng)?shù)木幊碳寄芘c數(shù)學(xué)知識(shí)接觸研究前沿。
6、《統(tǒng)計(jì)思維:程序員數(shù)學(xué)之概率統(tǒng)計(jì)》

本書(shū)是一本概率統(tǒng)計(jì)方面的入門(mén)圖書(shū),但視角極為獨(dú)特,折射出大數(shù)據(jù)浪潮的別樣風(fēng)景。作者將基本的概率統(tǒng)計(jì)知識(shí)融入Python編程,告訴你如何借助編寫(xiě)程序,用計(jì)算而非數(shù)學(xué)的方式實(shí)現(xiàn)統(tǒng)計(jì)分析。
7、《利用Python進(jìn)行數(shù)據(jù)分析》

本書(shū)含有大量的實(shí)踐案例,你將學(xué)會(huì)如何利用各種Python庫(kù)(包括NumPy、pandas、matplotlib以及IPython等)高效地解決各式各樣的數(shù)據(jù)分析問(wèn)題,十分適合剛剛接觸Python的分析人員以及剛剛接觸科學(xué)計(jì)算的Python程序員。
8、《Python數(shù)據(jù)科學(xué)手冊(cè)》

本書(shū)是對(duì)以數(shù)據(jù)深度需求為中心的科學(xué)、針對(duì)計(jì)算和統(tǒng)計(jì)方法的參考書(shū)。共有五章,每章介紹一到兩個(gè)Python數(shù)據(jù)科學(xué)中的重點(diǎn)工具包。本書(shū)適合有編程背景,并打算將開(kāi)源Python工具用作分析、操作、可視化以及學(xué)習(xí)數(shù)據(jù)的數(shù)據(jù)科學(xué)研究人員。
9、《Advanced and Multivariate Statistical Methods》

這是一本關(guān)于數(shù)據(jù)挖掘書(shū)籍,書(shū)中介紹了多種多元統(tǒng)計(jì)方法。