成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop,大數(shù)據(jù)離不開(kāi)它

大數(shù)據(jù) Hadoop
搭建數(shù)倉(cāng),hadoop雖然有點(diǎn)落伍,但還是不可或缺的。本文描述下單機(jī)版的hadoop運(yùn)作機(jī)制。

 [[399591]]

本文轉(zhuǎn)載自微信公眾號(hào)「虞大膽的嘰嘰喳喳」,作者虞大膽 。轉(zhuǎn)載本文請(qǐng)聯(lián)系虞大膽的嘰嘰喳喳公眾號(hào)。

搭建數(shù)倉(cāng),hadoop雖然有點(diǎn)落伍,但還是不可或缺的。本文描述下單機(jī)版的hadoop運(yùn)作機(jī)制。

HDFS是Google GFS的開(kāi)源實(shí)現(xiàn),是一個(gè)分布式文件系統(tǒng),是大數(shù)據(jù)技術(shù)的基石,直接上架構(gòu)圖:

主要包含Namenode和Datanodes,MapReduce主要就是在Datanodes進(jìn)行并行計(jì)算。

core-site.xml:

  1. <property> 
  2.     <name>fs.defaultFS</name
  3.     <value>hdfs://localhost:8001</value> 
  4. </property> 
  5. <property> 
  6.     <name>hadoop.tmp.dir</name
  7.     <value>/root/hadoop-3.2.2/tmp</value> 
  8. </property> 

 

其中8001端口就代表hdfs的根路徑,另外hdfs-site.xml配置參數(shù)也非常多。

比如dfs.replication表示hdfs副本集,單機(jī)版就設(shè)置1;dfs.namenode.http-address是NameNode web管理地址,可以查看hdfs的一些情況;dfs.datanode.address是DataNode的端口;dfs.namenode.name.dir和dfs.namenode.data.dir表示Namenode和Datanodes的存儲(chǔ)目錄,默認(rèn)繼承于hadoop.tmp.dir值。

如果修改目錄相關(guān)的參數(shù),需要格式化hdfs:

  1. $ bin/hdfs namenode -format 

經(jīng)驗(yàn)就是建議刪除dfs.namenode.data.dir下的文件,再格式化。

一旦hdfs可用,操作它們就像操作本地文件一樣:

  1. #創(chuàng)建登陸用戶的根目錄,有了根目錄,則不需要指定hdfs://前綴 
  2. $ ./bin/hdfs dfs -mkdir  -p  "hdfs://localhost:8001/user/root" 
  3. $ ./bin/hdfs dfs -mkdir  -p  test2 
  4.  
  5. $ ./bin/hdfs dfs -put ~/test.log hdfs://localhost:8001/test 
  6. $ ./bin/hdfs dfs -put ~/test.log test2 
  7.  
  8. $ ./bin/hdfs dfs -ls test2 
  9. $ ./bin/hdfs dfs -cat  test2/test.log 

接下去說(shuō)說(shuō)MapReduce,主要包含map和reduce過(guò)程,另外不能忘記shuffle,map相對(duì)于從hdfs dataNodes處理數(shù)據(jù),然后shuffle將相關(guān)聯(lián)的數(shù)據(jù)交給reduce進(jìn)行處理。

運(yùn)行MapReduce過(guò)程很簡(jiǎn)單:

  1. $ bin/hdfs dfs -mkdir input 
  2. $ bin/hdfs dfs -put etc/hadoop/*.xml input 
  3. # 將mapreduce任務(wù)執(zhí)行的結(jié)果放入 hdfs output 目錄中 
  4. $ bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.2.jar grep input output 'dfs[a-z.]+'  
  5. bin/hdfs dfs -cat output/* 

早期的MapReduce即包含計(jì)算框架,又包含調(diào)度框架,比較臃腫,比如想在當(dāng)前集群運(yùn)行另外一種計(jì)算任務(wù),就不方便了,所以后來(lái)從MapReduce中將調(diào)度框架抽取出來(lái),命名為Yarn,這樣不管是MapReduce還是Spark只要符合Yarn接口定義,就能被Yarn調(diào)度,MR和Spark專做做分布式運(yùn)算,相當(dāng)于解耦了。

Yarn的架構(gòu)圖如下:

主要包括ResourceManager和NodeManager,另外為了分布式運(yùn)算NodeManager一般和HDFS的DataNodes運(yùn)行在一起。

ResourceManager主要包含Scheduler和ApplicationsManager。

修改yarn-site.xml:

  1. <property> 
  2.     <name>yarn.nodemanager.aux-services</name
  3.     <value>mapreduce_shuffle</value> 
  4. </property> 
  5.  
  6. <property> 
  7.     <name>yarn.resourcemanager.webapp.address</name
  8.     <value>0.0.0.0:7088</value> 
  9. </property> 

 

其中,mapreduce_shuffle表示調(diào)度MapReduce任務(wù),7088 是Yarn的Web管理地址;當(dāng)然Yarn還有很多的參數(shù)。

修改 mapred-site.xml:

  1. <property> 
  2.     <name>mapreduce.framework.name</name
  3.     <value>yarn</value> 
  4. </property> 

 

mapreduce.framework.name的值yarn表示MapReduce使用Yarn調(diào)度。

然后執(zhí)行yarn調(diào)度:

  1. $ bin/yarn jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.2.jar grep input output 'dfs[a-z.]+' 

只是將上面的hadoop修改為yarn,不過(guò)結(jié)果測(cè)試,不管怎么寫,yarn都是生效的,通過(guò)yarn Web UI能看出來(lái)。

另外我是以root運(yùn)行的,所以sbin下的一些sh文件要修改:

  1. HDFS_DATANODE_USER=root 
  2. HDFS_DATANODE_SECURE_USER=root 
  3. HDFS_NAMENODE_USER=root 
  4. HDFS_SECONDARYNAMENODE_USER=root 

最后的啟動(dòng)命令:

  1. $ ./sbin/start-all.sh 
  2. $ ./sbin/stop-all.sh 

參考鏈接:

https://kontext.tech/column/hadoop/265/default-ports-used-by-hadoop-services-hdfs-mapreduce-yarn

https://hadoop.apache.org/docs/r3.2.2/hadoop-project-dist/hadoop-common/SingleCluster.html

 

責(zé)任編輯:武曉燕 來(lái)源: 虞大膽的嘰嘰喳喳
相關(guān)推薦

2015-10-13 10:41:39

大數(shù)據(jù)厚數(shù)據(jù)

2015-06-04 10:05:30

大數(shù)據(jù)分析認(rèn)知計(jì)算沃森

2018-03-26 14:02:53

2016-11-25 20:55:28

2014-04-14 10:37:55

工業(yè)互聯(lián)網(wǎng)云計(jì)算大數(shù)據(jù)

2020-04-28 10:35:14

數(shù)據(jù)安全

2016-05-03 15:12:35

數(shù)據(jù)科學(xué)

2013-08-05 11:15:45

GoogleNexus系列

2018-10-30 13:01:24

新華三

2021-09-03 08:44:51

內(nèi)核模塊Linux社區(qū)

2021-08-19 08:31:46

云計(jì)算

2015-02-03 10:32:19

軟件定義存儲(chǔ)SDS混合云

2018-06-05 23:41:11

2021-09-02 00:15:01

區(qū)塊鏈農(nóng)業(yè)技術(shù)

2024-11-05 19:10:17

2025-01-09 08:01:10

2013-09-23 16:15:15

輕應(yīng)用超級(jí)App何小鵬

2021-08-04 22:59:19

區(qū)塊鏈汽車技術(shù)

2016-09-06 17:21:00

APM聽(tīng)云用戶體驗(yàn)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 曰韩一二三区 | 精品国产伦一区二区三区观看方式 | 天天插天天狠天天透 | 人人玩人人添人人澡欧美 | 日日艹夜夜艹 | 国产精品精品3d动漫 | 91在线一区二区三区 | 伊人手机在线视频 | 精品99在线 | 日韩精彩视频 | 亚洲国产一区二区三区在线观看 | 男女免费视频网站 | 99在线免费观看 | 日本高清在线一区 | 国产精品99久久久久久久久久久久 | 日本黄色一级片视频 | 国产激情一区二区三区 | 中文字幕加勒比 | 丁香久久| 日本黄色高清视频 | 无码日韩精品一区二区免费 | 日韩国产在线观看 | 久久伊人精品 | 亚洲高清在线 | 国产精品1区 | 青青草免费在线视频 | 国产精品久久久久久久久久99 | 国产精品色 | 亚洲一区二区三区国产 | 久久99精品久久久久久国产越南 | 精品1区 | 国产高清视频一区二区 | 91免费在线看 | 精品视频一区二区在线观看 | 91久久久久久久 | аⅴ资源新版在线天堂 | 国产成人免费一区二区60岁 | 亚洲97 | 亚洲男人网 | 亚洲精品视频二区 | 亚洲国产成人精品久久 |