成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop實(shí)現(xiàn)技術(shù)轉(zhuǎn)折,從Yahoo走向Google

開發(fā) 架構(gòu) Hadoop
Hadoop相信大家應(yīng)該有所了解,這里向大家介紹一下Hadoop從Yahoo向Google的技術(shù)轉(zhuǎn)折,歡迎大家一起來關(guān)注,相信通過本文的介紹大家對Hadoop有新的認(rèn)識。

本節(jié)向大家介紹一下Hadoop從Yahoo向Google的技術(shù)轉(zhuǎn)折方面的內(nèi)容,Hadoop有很多值得學(xué)習(xí)的地方,這里就像大家簡單介紹一下有關(guān)Hadoop的轉(zhuǎn)折,歡迎大家一起來學(xué)習(xí)。

Hadoop從Yahoo向Google的技術(shù)轉(zhuǎn)折 

  ApacheHadoop,是一個模仿GoogleMapReduce架構(gòu)的開源軟件,雖然還沒有***正式發(fā)布,但是已經(jīng)非常有影響力了。

  僅僅一年的時間,Hadoop就發(fā)布了一個真正開源的穩(wěn)定版本,但是這個版本還不能稱為1.0,只能稱為0.20.0。盡管如此,Hadoop已經(jīng)成為eHarmony情人頻道、LinkedIn求職頻道、Fox互動媒體社區(qū)網(wǎng)站等很多大網(wǎng)站的搜索引擎了。另外默多克傳媒、MySpace、Photobucket以及RottenTomatoes也都表示Hadoop為他們提供了很大的幫助。

  在最近的一次采訪中,Hadoop創(chuàng)始人之一DougCutting表示自己都對Hadoop的發(fā)展速度感到吃驚。他說:“從Nutch(Hadoop的前身)開始探索網(wǎng)絡(luò)搜索以來,....我一直在尋找和挑戰(zhàn)突破”。還說;“那時候并沒有認(rèn)為我們已經(jīng)超出了現(xiàn)在大規(guī)模網(wǎng)站的索引環(huán)境”。
  但是在***個穩(wěn)定版本發(fā)布一年之后的幾個月里,也就是去年的ApacheCon會議上,關(guān)于Hadoop1.0以及2010年的方向的討論變得不可思議。
  該項(xiàng)目正朝著一個在無需打破用戶習(xí)慣、無需重新安裝軟件或損失數(shù)據(jù)的情況下就可以升級的目標(biāo)前進(jìn)。使用Hadoop,用戶在不需要徹底重建數(shù)據(jù)中心的情況下對系統(tǒng)進(jìn)行升級。


  Yahoo將Hadoop項(xiàng)目優(yōu)先級降低

  Cutting說,他的前雇主,也就是Yahoo,這個擁有眾多支持者的企業(yè)一直都是Hadoop的唯一支持者。但是現(xiàn)在遇到了一些挑戰(zhàn),因?yàn)閅ahoo已經(jīng)開始將重點(diǎn)傾斜向一些其他的項(xiàng)目了。搜索的另一個要求就是安全性,只有在安全的搜索保護(hù)下,人們才可以建設(shè)大規(guī)模私人信息集群,并且保證不讓其他人找到他們的信息。雖然安全也是Hadoop目標(biāo)之一,但是Yahoo更希望能夠快速推出可用的產(chǎn)品。Cutting說,Hadoop1.0可能沒有太大的改進(jìn),但是我們有很大的希望。

  有趣的轉(zhuǎn)折

  最初階段,Yahoo發(fā)起并推動了Hadoop項(xiàng)目,并為該項(xiàng)目提供了很大的幫助。但是在2000年之后,隨著Google公司的發(fā)展,Yahoo清楚的看到Hadoop不應(yīng)該僅僅是一個網(wǎng)絡(luò)搜索引擎,更應(yīng)該是一個能夠?yàn)榉植际綌?shù)據(jù)提供各種服務(wù)的運(yùn)算架構(gòu)。該架構(gòu)是基于Google分布式文件系統(tǒng)(GFS)以及MapReduce之上。在GFS和MapReduce之前,也就是2002年的時候,Cutting已經(jīng)創(chuàng)建了Nutch這個很完善的搜索引擎,但是后來開始遇到困難。Cutting說,當(dāng)時的工作內(nèi)容已經(jīng)涉及到整個互聯(lián)網(wǎng),對10億個網(wǎng)頁進(jìn)行操作是一個很痛苦的事情。

從Nutch到Hadoop

  Hadoop模仿GFS和MapReduce,將大量的數(shù)據(jù)分割成小的數(shù)據(jù)塊,以達(dá)到聯(lián)合數(shù)千個服務(wù)器快速搜索的目的,并且提供單一的訪問點(diǎn)。Cutting說,現(xiàn)在已經(jīng)能過搭建起基于20多臺服務(wù)器的演示案例,并在之上做一些實(shí)際的工作。但是不會達(dá)到所說的數(shù)千個服務(wù)器程度,因?yàn)槟敲炊喾?wù)器,在可靠性方面現(xiàn)在還確實(shí)沒有辦法保證。
  就在Yahoo參與和支持Nutch,并為該項(xiàng)目提供工程師和設(shè)備的時候,Yahoo軟件開發(fā)副總裁EricBaldeschwieler發(fā)現(xiàn)了該項(xiàng)目的另一個用途,也就是迅速分析和處理位于多個網(wǎng)絡(luò)服務(wù)器上的數(shù)據(jù)。于是Cutting從Nutch中將分布計(jì)算部分單獨(dú)分離為Hadoop項(xiàng)目。

  Cutting說Yahoo的研發(fā)人員希望從廣告以及web服務(wù)器獲取大量數(shù)據(jù)。如果你問一個Yahoo的研發(fā)人員如何提高廣告的相關(guān)性,他們會說首先把數(shù)據(jù)收集到一起,然后找到這些數(shù)據(jù)的早期用戶,這些人就是喜歡相關(guān)廣告的人。但是,如何分析網(wǎng)頁內(nèi)容幾周內(nèi)所發(fā)生的變化,這種變化每個小時都存在,并且會導(dǎo)致分散廣告點(diǎn)擊流量,以及如何在很短的時間內(nèi)處理上TB的數(shù)據(jù)。這些都是要處理的大問題在Yahoo將注意力放在安全問題上的時候,Cutting繼續(xù)為Hadoop項(xiàng)目尋找突破點(diǎn)。他希望有其他的非Java程序員能夠參與進(jìn)來,參與的方式可以通過Avro項(xiàng)目。

  Java之外

  Avro是一種數(shù)據(jù)交換格式,目標(biāo)是保證在應(yīng)用程序升級或修改之后依然能對數(shù)據(jù)進(jìn)行訪問。當(dāng)然目標(biāo)也包括Python、C、以及C++等其他程序語言能夠支持Hadoop、MapReduce和HDFS。
  在2009年8月,Cutting加入了Cloudera公司,該公司的業(yè)務(wù)是銷售流行開源技術(shù)和服務(wù)。雖然Hadoop已經(jīng)應(yīng)用在很多大型網(wǎng)站上,但是Cutting還是覺得Hadoop適合建立20個點(diǎn)左右的集群,這種集群應(yīng)該比通過數(shù)據(jù)庫處理堆積如山的數(shù)據(jù)更容易。Cloudera的客戶包括NetFlix和三星公司。

  如果不希望在自己的企業(yè)里使用Hadoop,那么也可以像Amazon和Rackspace一樣,采用Hadoop提供云服務(wù)。雖然這樣做有點(diǎn)難,但是已經(jīng)有很好的支持工具了。Cutting還保證Hadoop的目標(biāo)就是隱藏復(fù)雜的細(xì)節(jié),對外提供簡單的接口。
  雖然現(xiàn)在Cutting還沒有確切的計(jì)劃,但是不會拖延Hadoop的推出。

【編輯推薦】

  1. 開源框架Hadoop實(shí)現(xiàn)分布式計(jì)算
  2. Hadoop0.20.2集群配置入門指導(dǎo)手冊
  3. Hadoop文件系統(tǒng)如何快速安裝?
  4. Cloudera下實(shí)現(xiàn)Hadoop方案規(guī)劃
  5. Hadoop完全分布模式安裝實(shí)現(xiàn)詳解

 

責(zé)任編輯:佚名 來源: PHPChina.com
相關(guān)推薦

2010-05-19 11:29:41

HadoopYahooGoogle

2009-06-12 19:03:41

Hadoop源代碼Yahoo

2012-09-28 11:29:35

創(chuàng)業(yè)GooglePageRank

2012-11-16 11:40:56

Google數(shù)據(jù)中心服務(wù)器

2012-11-12 10:13:09

2021-04-16 10:32:28

蜜罐網(wǎng)絡(luò)安全

2018-10-09 14:45:02

技術(shù)型管理型工資

2014-03-07 09:28:52

SDN技術(shù)SDN軟件定義網(wǎng)絡(luò)

2018-06-29 14:46:45

開源技術(shù) 趨勢

2011-10-17 09:26:48

微軟Hadoop

2009-06-01 09:46:57

2017-10-21 09:44:07

云計(jì)算

2009-06-03 15:14:04

SOA應(yīng)用耦合

2016-09-05 17:32:22

2019-02-11 09:41:07

IT技術(shù)管理

2020-11-13 11:21:52

華為鳳凰引擎

2011-12-02 10:14:26

云計(jì)算云服務(wù)

2013-05-13 10:03:28

萬兆萬兆以太網(wǎng)萬兆接入

2011-10-25 10:22:57

Siri
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 97国产精品 | 国产一区二区免费在线 | 96av麻豆蜜桃一区二区 | 久久久精品视频一区二区三区 | 中文字幕第一页在线 | 日韩免费中文字幕 | 亚洲视频在线观看 | 日韩中字幕 | 人人干人人超 | 国产精品久久久久久久午夜片 | 亚洲国产精品一区二区第一页 | 中文字幕一区二区三 | 欧美视频区 | 一二区成人影院电影网 | 在线一区视频 | 免费观看av网站 | 成人影视网址 | 伊人伊人网 | 日本一区二区三区在线观看 | 国产日韩欧美精品一区二区三区 | 中文字幕91av | 久久久久国产一区二区三区四区 | 精品一区二区在线观看 | 毛片在线免费 | www.788.com色淫免费 | 国产一区二区三区四区三区四 | 波多野结衣精品在线 | 99精品在线观看 | 欧美精品成人一区二区三区四区 | 成人一区二区在线 | 亚洲男人天堂网 | 免费特黄视频 | 久久久久久久久淑女av国产精品 | 日韩在线中文 | 久久久久久国产精品 | 欧美一级做性受免费大片免费 | 亚洲国产区| 久久狠狠 | 国产欧美日韩在线播放 | 亚洲精品视频免费观看 | 激情欧美日韩一区二区 |