Hadoop分布式文件系統(tǒng)安全隱患不得不防
本節(jié)向大家介紹一下Hadoop分布式文件系統(tǒng)既是HDFS的安全隱患問(wèn)題,主要包括Hadoop概念和配置介紹,HDFS環(huán)境和安全隱患等內(nèi)容,歡迎大家一起來(lái)學(xué)習(xí),希望通過(guò)本節(jié)的介紹大家對(duì)HDFS安全隱患有一定的認(rèn)識(shí),以便在以后學(xué)習(xí)和使用Hadoop過(guò)程中減少不必要的麻煩。
Hadoop分布式文件系統(tǒng)(HDFS)的安全隱患
一.基礎(chǔ)問(wèn)題
hadoop是什么?如何配置等基礎(chǔ)概念以下不做討論.
一個(gè)分布式系統(tǒng)基礎(chǔ)架構(gòu),由Apache基金會(huì)開(kāi)發(fā)。用戶可以在不了解分布式底層細(xì)節(jié)的情況下,開(kāi)發(fā)分布式程序。充分利用集群的威力高速運(yùn)算和存儲(chǔ)。
簡(jiǎn)單地說(shuō)來(lái),Hadoop是一個(gè)可以更容易開(kāi)發(fā)和運(yùn)行處理大規(guī)模數(shù)據(jù)的軟件平臺(tái)。
Hadoop實(shí)現(xiàn)了一個(gè)分布式文件系統(tǒng)(HadoopDistributedFileSystem),簡(jiǎn)稱HDFS。HDFS有著高容錯(cuò)性(fault-tolerent)的特點(diǎn),并且設(shè)計(jì)用來(lái)部署在低廉的(low-cost)硬件上。而且它提供高傳輸率(highthroughput)來(lái)訪問(wèn)應(yīng)用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(largedataset)的應(yīng)用程序。HDFS放寬了(relax)POSIX的要求(requirements)這樣可以流的形式訪問(wèn)(streamingaccess)文件系統(tǒng)中的數(shù)據(jù)。
二.Hadoop分布式文件系統(tǒng)環(huán)境
軟件環(huán)境:hadoop-0.19.1
HDFS系統(tǒng):公網(wǎng)linux2.4若干臺(tái)
Namenode:nn1臺(tái)
Datenode:dn若干臺(tái)
客戶端:OSX10.6
三.如何對(duì)Hadoop文件進(jìn)行攻擊要點(diǎn)(安全隱患)
1)
獲得HadoopNameNodeURI,例如nn:9001
配置到客戶端hadoop-site.xml中即可.
2)
客戶端通過(guò)FSshell進(jìn)行文件操作,
次步驟可簡(jiǎn)單理解為客戶端通過(guò)本地Hadoop中配置hadoop-site.xmlnamenodeuri進(jìn)行遠(yuǎn)程訪問(wèn),獲取HDFS文件列表,
3)
*如遇到驗(yàn)證失敗,在本地創(chuàng)建用戶名xxx用戶,xxx本地用戶名和提示驗(yàn)證用戶名稱一直即可.
*解釋:HDFS啟動(dòng)時(shí)會(huì)以啟動(dòng)用戶(root或hadoop)為HDFSRoot用戶,所以客戶端進(jìn)行訪問(wèn)時(shí)本地新建此用戶名和HDFSRoot用戶名稱一致即可,HDFS并不進(jìn)行驗(yàn)證密碼.
*此時(shí),就獲得的HDFS系統(tǒng)的HDFSRoot權(quán)限,可以為所欲為了.:)
4)
HadoopAPI與FSShell以上述同理
四.思考
雖然nn可以設(shè)置的比較隱秘,但是依然可以被掃描到,所以只靠隱秘nn方法對(duì)HDFS系統(tǒng)的安全保障是并不可取的.
雖然可以用網(wǎng)絡(luò)劃分或防火墻進(jìn)行隔離,但是對(duì)于Hadoop框架設(shè)計(jì)而言,是有重大安全遺漏的.
我認(rèn)為依然有許多HDFS系統(tǒng)目前正在公網(wǎng)運(yùn)行中本節(jié)關(guān)于Hadoop分布式文件系統(tǒng)的安全隱患介紹到這里。
【編輯推薦】