15種最佳方式幫你順利掌握Hadoop技術
譯文在探討今天的主題——如何利用各類資源學習Hadoop知識——之前,讓我們首先搞清楚另一個問題:大數(shù)據(jù)Hadoop到底是什么?簡單來講,Hadoop是一套用于實現(xiàn)大數(shù)據(jù)技術的框架方案。為了順利掌握Hadoop,大家需要理解兩項與文件存儲以及數(shù)據(jù)處理緊密相關的基礎知識。在Hadoop當中,我們甚至可以保存比可用存儲空間更大的文件。Hadoop提供相關選項,允許大家將大型文件存儲在節(jié)點之上。很明顯,處理規(guī)模如此可觀的文件絕非兒戲,不過Hadoop能夠引入“MapReduce”機制讓一切變得更為簡單。MapReduce也是一套框架,其主要任務就是實現(xiàn)數(shù)據(jù)處理。MapReduce能夠以迅如閃電的速度完成數(shù)據(jù)處理任務,從而幫助我們節(jié)約大量時間。
實踐證明,Hadoop確實擁有重要的實際價值,而這種價值主要體現(xiàn)在由其提供的各類特性當中。Hadoop的顯著特性包括以下幾點:
- 易于擴展: Hadoop是一套具備可擴展能力的存儲平臺,其能夠將數(shù)據(jù)分發(fā)至成千上萬個分布式節(jié)點及低成本服務器之上,并讓這些硬件設備以并行方式共同處理同一任務。
- 靈活性: Hadoop并不會對數(shù)據(jù)類型或者數(shù)據(jù)來源作出任何硬性限制。我們可以輕松利用它處理點擊流數(shù)據(jù)、欺詐檢測、電子郵件會話、社交媒體以及日志處理等工作。
- 性價比出色: 傳統(tǒng)存儲系統(tǒng)面臨的最大問題在于極為昂貴的使用成本,但Hadoop的出現(xiàn)卻能夠幫助大家節(jié)約下非常驚人的寶貴資金。
目前幾乎每一家IT技術巨頭企業(yè)都在使用Hadoop進行數(shù)據(jù)管理。在Hadoop使用方面,最值得一提的企業(yè)包括Amazon、Adobe、阿里巴巴、Cloudspace、EBay、Facebook、IBM、雅虎以及Twitter等等。
隨著Hadoop在應用領域的人氣不斷攀升,大量令人興奮的全新發(fā)展機遇也由此陸續(xù)出現(xiàn)。為了幫助大家成為大數(shù)據(jù)與Hadoop技術層面的緊俏人才,我們整理出了15種學習Hadoop技術的最佳方式及資源,下面一起來看。
Hadoop文字教程
tutorialspoint
這份教程能夠為大家提供良好的技術指導,而且也用事實驗證了自身的出色水平。它針對大數(shù)據(jù)概念快速理解、Hadoop分布式文件系統(tǒng)以及MapReduce算法提供了簡潔易懂的教學方案,能夠幫助各位新手輕松掌握Hadoop。這套教程適用于ETL開發(fā)人員、軟件專家以及分析專業(yè)人士。
coreservlets
Core Servlets提供一套清晰易行的Hadoop學習教程。其中每個章節(jié)都包含練習內容以及相應的解決方案提示,這樣大家就能夠在無需求助于他人的前提下自行學習。這份教程同時也非常適用于那些擁有一定Java編程知識的學習者。在認真研讀之后,相信大家一定能建立起堅實的Hadoop專業(yè)知識基礎。
3) Vogella
vogella
Vogella提供一系列與Hadoop學習相關的簡短教程。作為學習起點,它首先通過概述幫助大家理解Hadoop宏觀概念、利用Hadoop能夠完成哪些任務并闡述了映射與歸約兩大基本功能的確切定義。這份教程涵蓋了多項基本議題,包括文件系統(tǒng)、映射歸約及其安裝指南。
4) Guru99
guru99
Guru99提供一套基于Hadoop的深層指導方案。它采用大量示例加圖表的配合方式,能夠幫助大家輕松學習到Hadoop相關知識。可以說,它是我們所見過的最為簡單易行的Hadoop學習教程。其中的具體議題則包括技術介紹、安裝、映射歸約以及由大量代碼及注釋實現(xiàn)的示例方案。
5) Hortonworks
hortonworks
Hortonworks針對Hadoop提供一系列非常優(yōu)秀的教程資料。除了常規(guī)教程內容之外,它還提供與Hadoop相關的認證機制。這項資質認證能夠幫助專業(yè)人士開啟大數(shù)據(jù)技術領域的職業(yè)生涯。它的涵蓋范圍很廣,但同時又不失深度。
Hadoop視頻教程
6) Udemy
udemy
Udemy在技術視頻教程領域已經擁有相當一段時間的從業(yè)經歷,而且事實證明其表現(xiàn)算得上可圈可點。它以完整教程的形式對Hadoop認證的各個層面作出了清晰而詳盡的解釋,從而使學習過程充滿樂趣。對于Hadoop毫無概念的新人同樣能夠在它的幫助下輕松建立并提升自己的Hadoop專業(yè)知識。值得一提的是,它甚至能夠用輕松易懂的方式闡述MapReduce等相當艱深的概念。
7) Eduonix
eduonix
這套教程由多位訓練有素的專業(yè)人員共同打造,力爭幫助大家扎實穩(wěn)健地一步步完成自己的大數(shù)據(jù)與Hadoop培訓之路。其中包含有74次講座以及長達15.5小時的視頻內容。除了清晰闡述各類核心技術概念之外,它還解釋了MapReduce等特定定義的具體內容。如果大家有意在Hadoop領域試試身手,那么這套教程無疑應該成為各位的必修課程。
8) Simplilearn
simplilearn
這套教程擁有明確的定義以及理想的結構設置,即使是來自其它行業(yè)、毫無技術基礎的朋友也能輕松理解。大家還可以選擇與Hadoop相關的認證資質,并借此幫助自己從競爭對手當中脫穎而出。這套在線Hadoop培訓資源以Hadoop技術簡介作為起點,而后解釋了相關架構并隨進度推移提出更多高級技術概念。
9) Edureka
edureka
掌握Hadoop雖然說不上困難無比,但前提是大家需要具備一定程度的Java核心知識。幸運的是,Edureka在《面向Hadoop的Java基礎》當中提供豐富的學習資源。為了完成配套習題,大家需要在自己的系統(tǒng)當中安裝Edureka虛擬機。如果各位的系統(tǒng)無法滿足配置要求,也可以遠程訪問Edureka集群。這套教程還擁有另一大令人印象深刻的特色,其出色的技術支持團隊能夠快速解答我們學習過程中遇到的各類難題。
Hadoop論著
10) Eric Sammer撰寫的Hadoop Operations
Hadoop Operations by Eric Sammer
這本書明確闡述了如何建立并維護一套Hadoop集群。它甚至以每分鐘為單位進行詳盡說明,同時從操作系統(tǒng)層面出發(fā)指導大家進行細微調試。另外,它也介紹了大量先進議題,具體包括MapReduce、HDFS架構、YARN執(zhí)行模式以及集群配置等等。
11) Boris Lublinsky撰寫的Professional Hadoop Solutions
Professional Hadoop Solutions by Boris Lublinsky
這本書以MapReduce編程作為開篇,并通過三個章節(jié)以深層方式對這一議題進行了全面探究。而包括Oozie在內的其它議題同樣非常重要,其能夠以深入淺出的方式幫助我們學會如何開發(fā)出一套大規(guī)模處理系統(tǒng)。幾乎沒有幾部論著會從Oozie這樣具體的議題出發(fā)進行學習指導,但這本書做到了——它對Hadoop的各個相關概念都作出了細致闡述。
12) Tom White撰寫的Hadoop the Definitive Guide
Hadoop the Definitive Guide by Tom White
這本書在Hadoop開發(fā)者當中極受歡迎,有些人甚至將其視為Hadoop學習的圣經。不過需要強調的是,它的定位并非完全為了幫助新手學習Hadoop知識。這本書的開篇部分成為理解后續(xù)內容的基石,但也需要大家拿出時間和精力好好研討。不過只要啃下了開頭部分,那么在接下來的學習過程中,各位肯定能感受到這部論著的出色之處。
13) Donald Miner與Adam Shook撰寫的Map Reduce design pattern
Map Reduce design pattern by Donald Miner and Adam Shook
這本書能夠幫助大家輕松建立起對各類關鍵性概念的印象,并提供大量示例以降低理解難度。但需要指出的是,這本書并非為新人所編寫,大家至少需要在開始閱讀之前對云計算以及Hadoop有所了解。本書還將各類映射歸約算法一網(wǎng)打盡,可以說是每一位有理想、有抱負的開發(fā)人員不能錯過的經典論著。
14) Chuck Lam撰寫的Hadoop in Action
Hadoop in Action by Chuck Lam
這本書以非常簡單易行的方式解釋了與Hadoop相關的知識要點,即使是剛剛上手的新人也能輕松掌握。本書的前三章涵蓋了Hadoop技術的基礎性內容,接下來的三章專注于MapReduce算法,而最后則面向五種常見MapReduce技術作出闡釋。
Pro Hadoop by Jason Venner
這本書的立意在于撥亂反正,幫助大家了解如何避免各類常見編程錯誤以及如何對這些問題進行排查。這是一部新人在學習過程中不可錯過的寶典,因為其中的全部議題皆以簡潔易懂的方式進行說明。
隨著云計算的迅速崛起以及數(shù)據(jù)管理資源的嚴重缺失,我們需要一種新的技術成果解決此類問題,而Hadoop確實能夠很好地完成這項歷史任務。Hadoop的未來可謂一片光明,而希望借此良機實現(xiàn)職業(yè)生涯飛躍的從業(yè)者們則應當馬上投入學習,并由此踏上另一條不同于以往的發(fā)展道路。因此,希望大家能夠在了解到這份推薦清單之后從中找到適合自己的學習資源,并在自我提升的道路上高歌猛進。
相信大家在Hadoop學習過程當中,也整理出了自己的一套心得體會。請在評論欄中與大家分享您的真知灼見,我們期待著來自您的更多大數(shù)據(jù)及Hadoop學習資源推薦。
原文標題:15 Best ways to learn Hadoop Technology
核子可樂譯