成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop初探

開發(fā) 架構(gòu) Hadoop
最近發(fā)現(xiàn)有不少網(wǎng)友問什么是Hadoop,這里就向大家介紹一下Hadoop的相關(guān)內(nèi)容,希望通過本文的介紹大家對Hadoop有一定的認(rèn)識,歡迎大家一起來學(xué)習(xí)Hadoop。

本節(jié)向大家描述一下什么是Hadoop,主要內(nèi)容有Hadoop概念介紹和Hadoop開源的實(shí)現(xiàn)等,相信看完本文的介紹,大家對Hadoop有更深刻的認(rèn)識。

Hadoop是什么 
   Hadoop 是一個(gè)分布式系統(tǒng)基礎(chǔ)架構(gòu),由Apache基金會開發(fā)。用戶可以在不了解分布式底層細(xì)節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力高速運(yùn)算和存儲。項(xiàng)目主頁:http://hadoop.apache.org

Hadoop是一個(gè)用于運(yùn)行應(yīng)用程序在大型集群的廉價(jià)硬件設(shè)備上的框架。Hadoop為應(yīng)用程序透明的提供了一組穩(wěn)定/可靠的接口和數(shù)據(jù)運(yùn)動。在Hadoop中實(shí)現(xiàn)了Google的MapReduce算法,它能夠把應(yīng)用程序分割成許多很小的工作單元,每個(gè)單元可以在任何集群節(jié)點(diǎn)上執(zhí)行或重復(fù)執(zhí)行。此外,Hadoop還提供一個(gè)分布式文件系統(tǒng)用來在各個(gè)計(jì)算節(jié)點(diǎn)上存儲數(shù)據(jù),并提供了對數(shù)據(jù)讀寫的高吞吐率。由于應(yīng)用了map/reduce和分布式文件系統(tǒng)使得Hadoop框架具有高容錯(cuò)性,它會自動處理失敗節(jié)點(diǎn)。已經(jīng)在具有600個(gè)節(jié)點(diǎn)的集群測試過Hadoop框架。

Google的數(shù)據(jù)中心使用廉價(jià)的Linux PC機(jī)組成集群,在上面運(yùn)行各種應(yīng)用。即使是分布式開發(fā)的新手也可以迅速使用Google的基礎(chǔ)設(shè)施。核心組件是3個(gè):

1、GFS(Google File System)。一個(gè)分布式文件系統(tǒng),隱藏下層負(fù)載均衡,冗余復(fù)制等細(xì)節(jié),對上層程序提供一個(gè)統(tǒng)一的文件系統(tǒng)API接口。Google根據(jù)自己的需求對它進(jìn)行了特別優(yōu)化,包括:超大文件的訪問,讀操作比例遠(yuǎn)超過寫操作,PC機(jī)極易發(fā)生故障造成節(jié)點(diǎn)失效等。GFS把文件分成64MB的塊,分布在集群的機(jī)器上,使用Linux的文件系統(tǒng)存放。同時(shí)每塊文件至少有3份以上的冗余。中心是一個(gè)Master節(jié)點(diǎn),根據(jù)文件索引,找尋文件塊。詳見Google的工程師發(fā)布的GFS論文。

2、MapReduce。Google發(fā)現(xiàn)大多數(shù)分布式運(yùn)算可以抽象為MapReduce操作。Map是把輸入Input分解成中間的Key/Value對,Reduce把Key/Value合成最終輸出Output。這兩個(gè)函數(shù)由程序員提供給系統(tǒng),下層設(shè)施把Map和Reduce操作分布在集群上運(yùn)行,并把結(jié)果存儲在GFS上。

3、BigTable。一個(gè)大型的分布式數(shù)據(jù)庫,這個(gè)數(shù)據(jù)庫不是關(guān)系式的數(shù)據(jù)庫。像它的名字一樣,就是一個(gè)巨大的表格,用來存儲結(jié)構(gòu)化的數(shù)據(jù)。

開源實(shí)現(xiàn)

這個(gè)分布式框架很有創(chuàng)造性,而且有極大的擴(kuò)展性,使得Google在系統(tǒng)吞吐量上有很大的競爭力。因此Apache基金會用Java實(shí)現(xiàn)了一個(gè)開源版本,支持Fedora等Linux平臺。目前Hadoop受到Y(jié)ahoo的支持,有Yahoo員工長期工作在項(xiàng)目上,而且Yahoo內(nèi)部也準(zhǔn)備使用Hadoop代替原來的基于FreeBSD的系統(tǒng)。
Hadoop實(shí)現(xiàn)了HDFS文件系統(tǒng)和MapRecue。目前版本是0.16。還不成熟,但是已經(jīng)可以在2000個(gè)節(jié)點(diǎn)上運(yùn)行。用戶只要繼承MapReduceBase,提供分別實(shí)現(xiàn)Map和Reduce的兩個(gè)類,并注冊Job即可自動分布式運(yùn)行。

HDFS把節(jié)點(diǎn)分成兩類:NameNode和DataNode。NameNode是***的,程序與之通信,然后從DataNode上存取文件。這些操作是透明的,與普通的文件系統(tǒng)API沒有區(qū)別。
MapReduce則是JobTracker節(jié)點(diǎn)為主,分配工作以及負(fù)責(zé)和用戶程序通信。

目前這個(gè)項(xiàng)目還在進(jìn)行中,還沒有到達(dá)1.0版本,和Google系統(tǒng)的差距也非常大,但是進(jìn)步非常快,值得關(guān)注。另外,這是云計(jì)算(Cloud Computing)的初級階段的實(shí)現(xiàn),是通向未來的橋梁。

【編輯推薦】

  1. 學(xué)習(xí)筆記 Hadoop是什么?
  2. 如何進(jìn)行Hadoop安裝部署?
  3. Hadoop集群與Hadoop性能優(yōu)化
  4. Hadoop 從Yahoo向Google的技術(shù)轉(zhuǎn)折
  5. Yahoo公布Hadoop的源代碼

 

 

責(zé)任編輯:佚名 來源: csdn.net
相關(guān)推薦

2012-07-05 10:51:57

Hadoop集群

2022-07-20 15:10:38

Docker大數(shù)據(jù)平臺

2016-10-11 13:48:41

WebGLJavascriptWeb

2009-06-24 13:22:27

Glassfish

2011-04-18 09:53:08

Ruby

2011-05-17 14:11:06

Dijkstra

2014-11-20 15:44:40

Apple Watch

2015-01-21 16:35:49

Apple WatchWatchKit

2012-02-29 15:03:30

2011-08-24 09:30:29

JavaJVM

2012-04-05 13:50:38

Java

2012-07-09 10:22:28

Mono for An

2013-04-10 11:23:27

2021-04-14 09:33:58

Kubernetes通信網(wǎng)絡(luò)模型

2011-06-16 10:25:29

AndroidAIR

2010-09-08 17:26:46

JavaScript

2017-05-29 08:18:11

Serverless架構(gòu)軟件系統(tǒng)

2013-09-09 09:41:34

2011-09-14 14:15:25

IBMAIX 7操作系統(tǒng)

2020-05-21 07:00:00

軟件定義網(wǎng)絡(luò)SDN網(wǎng)絡(luò)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 日本电影韩国电影免费观看 | 一级美国黄色片 | 少妇一级淫片免费播放 | 亚洲www啪成人一区二区麻豆 | 亚洲精品久久久久久一区二区 | 精品无码久久久久久久动漫 | 亚州综合一区 | 91精品国产综合久久久久久蜜臀 | 美女网站视频免费黄 | 国产这里只有精品 | 久久久久国产成人精品亚洲午夜 | 久久神马 | 色偷偷888欧美精品久久久 | 亚洲精品在线播放 | 成人精品一区 | 亚洲黄色在线免费观看 | 国产精品区一区二区三区 | 97国产精品 | 国产午夜精品一区二区三区四区 | 欧洲精品一区 | 欧美一级三级在线观看 | 国产精品一区2区 | 久久久久久久久久久久久久av | 欧美性乱 | 日韩手机在线看片 | 亚洲一区 中文字幕 | 在线观看成人 | 五月综合久久 | 福利视频网站 | 欧美乱码精品一区二区三区 | hitomi一区二区三区精品 | 精品免费国产 | a在线观看 | 亚洲一级毛片 | 99re在线视频观看 | 伊人成人免费视频 | 欧美精品一区三区 | 久久中文字幕一区 | 国产精品高潮呻吟久久 | 2022国产精品| av网站在线播放 |