成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

簡(jiǎn)單的介紹一下大數(shù)據(jù)中最重要的MapReduce

大數(shù)據(jù)
MapReduce是分布式運(yùn)行的,由兩個(gè)階段組成:Map和Reduce,Map階段是一個(gè)獨(dú)立的程序,有很多個(gè)節(jié)點(diǎn)同時(shí)運(yùn)行,每個(gè)節(jié)點(diǎn)處理一部分?jǐn)?shù)據(jù)。

簡(jiǎn)單的介紹一下大數(shù)據(jù)中最重要的MapReduce
MapReduce執(zhí)行流程圖

概述

MapReduce是一種分布式計(jì)算模型,由Google提出,主要用于搜索領(lǐng)域,解決海量數(shù)據(jù)的計(jì)算問題。

MapReduce是分布式運(yùn)行的,由兩個(gè)階段組成:Map和Reduce,Map階段是一個(gè)獨(dú)立的程序,有很多個(gè)節(jié)點(diǎn)同時(shí)運(yùn)行,每個(gè)節(jié)點(diǎn)處理一部分?jǐn)?shù)據(jù)。

Reduce階段是一個(gè)獨(dú)立的程序,有很多個(gè)節(jié)點(diǎn)同時(shí)運(yùn)行,每個(gè)節(jié)點(diǎn)處理一部分?jǐn)?shù)據(jù)。

使用

MapReduce框架都有默認(rèn)實(shí)現(xiàn),用戶只需要覆蓋map()和reduce()兩個(gè)函數(shù),即可實(shí)現(xiàn)分布式計(jì)算,非常簡(jiǎn)單。

這兩個(gè)函數(shù)的形參和返回值都是,使用的時(shí)候一定要注意構(gòu)造。

 

簡(jiǎn)單的介紹一下大數(shù)據(jù)中最重要的MapReduce

執(zhí)行流程(此處舉例說明)

  1. 一個(gè)文本(在HDFS上面保存,兩個(gè)block)中每一個(gè)單詞的出現(xiàn)的次數(shù): 
  2.     hello you hello marry 
  3.     hello me really 
  4.             ----->block-1 
  5.              
  6.     hello kate ready 
  7.     xiao wang hello tomcat 
  8.             ----->block-2 

1.獲取每一個(gè)block塊中的文本,遍歷所有,回去其中的一行str

因?yàn)橐y(tǒng)計(jì)的是每一個(gè)單詞i的次數(shù),所以還需要直到文本中有哪些單詞,可以根據(jù)字符串的特點(diǎn),使用split()進(jìn)行切割。

  1. String[] words=str.split(""); 

根據(jù)要求,需將每一個(gè)單詞i轉(zhuǎn)換為的形式,k為單詞本身,v為單詞出現(xiàn)的次數(shù)。

2.因?yàn)閙r的計(jì)算是分布式的 ,每一個(gè)map(稱之為一個(gè)mapper task)計(jì)算其中的一個(gè)block塊數(shù)據(jù)。

  1. map階段: 
  2.     輸入<K1,V1> 
  3.         k1,偏移量,v1,當(dāng)前行文本內(nèi)容 
  4.         map()函數(shù)操作 
  5.     輸出<K2,V2> 
  6.         k2,具體單詞,v2,單詞對(duì)應(yīng)的統(tǒng)計(jì)項(xiàng),比如次數(shù) 
  7.     輸出<K2,V2> 
  1. shuffle階段 
  2. 研究后發(fā)現(xiàn),如果按照<key,1>這種方式向reduce輸出數(shù)據(jù)的時(shí)候,會(huì)有 
  3. 大量的冗余數(shù)據(jù)。 
  4. 比如map階段之后有5個(gè)hello,則輸出<hello,1>,<hello,1>,<hello,1>, 
  5. <hello,1>,<hello,1>5次,實(shí)際上會(huì)對(duì)網(wǎng)絡(luò)造成一定的壓力,能不能對(duì) 
  6. 這5個(gè)<hello,1>進(jìn)行一個(gè)進(jìn)入reduce之前的本地組合?比如成為 
  7. <hello,5>或者<hello,[1,1,1,1,1]>. 
  8. 這個(gè)過程成為shuffle,洗牌重組階段,達(dá)到上述的結(jié)果,稱之為規(guī)約。 
  9. >>>shuffle階段,也就是對(duì)map的輸出進(jìn)行重新洗牌: 
  10. 分區(qū)、分組、排序 
  11. <K2,V2>...===><K2,V2s> 
  1. reduce階段 
  2. 接收map的輸出結(jié)果<key,values
  3. 對(duì)這個(gè)結(jié)果進(jìn)行匯總統(tǒng)計(jì),針對(duì)values,進(jìn)行簡(jiǎn)單的累加,計(jì)算得出key 
  4. 對(duì)應(yīng)的次數(shù) 
  5. reduce針對(duì)一個(gè)key調(diào)用一次reduce()函數(shù) 
  6. =====>reduce 階段 
  7. 輸入<K2,V2> 
  8.     K2,就是map的輸出的K2,V2s是map經(jīng)過shuffle之后的結(jié)果集 
  9.     reduce()函數(shù)操作 
  10. 轉(zhuǎn)化為<K3,V3>   

經(jīng)過上述操作之后,系統(tǒng)會(huì)將計(jì)算結(jié)果輸出給用戶,一般會(huì)先存儲(chǔ)(落地)到hdfs,然后反饋給用戶。

到此為止,MapReduce執(zhí)行完畢,接下來就可以進(jìn)行大數(shù)據(jù)的其他一系列操作了。

責(zé)任編輯:未麗燕 來源: 今日頭條
相關(guān)推薦

2025-05-28 10:05:00

Linux系統(tǒng)/proc

2011-08-03 15:14:17

Excel XP數(shù)據(jù)庫功能

2011-07-20 16:13:03

SQL Profile數(shù)據(jù)庫

2022-10-08 23:46:47

JavaScript對(duì)象開發(fā)

2020-03-01 17:53:38

Excel大數(shù)據(jù)微軟

2011-07-26 18:22:42

MySQL Workb數(shù)據(jù)庫

2011-08-22 15:19:25

2011-07-20 17:31:36

關(guān)系型數(shù)據(jù)庫

2011-08-05 09:33:56

OracleUser ProcesServer Proc

2010-06-13 17:57:23

局域網(wǎng)協(xié)議

2011-08-03 09:15:23

DORADO展現(xiàn)中間件

2024-05-13 08:16:59

React任務(wù)調(diào)度鏈表結(jié)構(gòu)

2021-01-21 14:33:38

大數(shù)據(jù)大數(shù)據(jù)應(yīng)用

2021-01-21 22:23:57

大數(shù)據(jù)石油智慧交通

2011-08-30 11:22:17

OracleDatabase Li

2011-07-29 13:40:34

Oracle數(shù)據(jù)庫PLSQL異常處理

2011-08-09 15:25:14

線程池數(shù)據(jù)庫連接池

2020-08-12 10:56:55

數(shù)據(jù)管理數(shù)據(jù)數(shù)據(jù)分析

2018-04-08 16:03:16

2011-07-27 14:41:59

Oracle ERP
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 亚洲va欧美va天堂v国产综合 | 成人免费在线视频 | 国产精品一级在线观看 | 欧美精品首页 | 日本成人免费网站 | 一区二区三区亚洲 | 精产嫩模国品一二三区 | 国产99久久精品 | 欧美亚洲国产日韩 | 青青草精品视频 | 国产精品视频久久久久 | 久热精品在线 | 亚洲一区二区视频 | 亚洲一区视频在线 | 成人午夜在线观看 | www.成人.com | 精品入口麻豆88视频 | 激情欧美一区二区三区 | 中文无码日韩欧 | 国产精品久久av | 欧美精品1区2区3区 精品国产欧美一区二区 | 综合久久综合久久 | 日韩欧美一级精品久久 | 成人字幕网zmw | 草草网 | 久久精品成人 | 久久精品亚洲精品国产欧美 | 国产精品毛片一区二区在线看 | 欧美一级片在线看 | 成人在线视频网站 | 中文字幕在线剧情 | 天堂资源最新在线 | 国产高清美女一级a毛片久久w | 欧美一级免费 | 天堂资源视频 | 国产精品美女久久久 | 日韩毛片在线免费观看 | 日韩av福利在线观看 | 蜜桃毛片 | 中文字幕一区二区三区日韩精品 | 日本网站免费观看 |