成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop 從Yahoo向Google的技術轉折

原創(chuàng)
開發(fā) 后端 Hadoop
MapReduce和GFS是Google大規(guī)模數(shù)據(jù)處理以及網(wǎng)絡資源訪問技術,這兩項技術可以說是Google的生命源頭和根基。Yahoo前工程師Doug Cutting,也就是Nutch的主要開發(fā)者今日詳細解釋了Nutch分支項目Hadoop發(fā)展目標,就是要模擬MapReduce和GFS,支持大規(guī)模集群甚至云計算。我們希望早日能夠看到Hadoop正式版本的發(fā)布。

【51CTO快譯】Apache Hadoop,是一個模仿Google MapReduce架構的開源軟件,雖然還沒有***正式發(fā)布,但是已經(jīng)非常有影響力了。

僅僅一年的時間,Hadoop就發(fā)布了一個真正開源的穩(wěn)定版本,但是這個版本還不能稱為1.0,只能稱為0.20.0。盡管如此,Hadoop已經(jīng)成為eHarmony情人頻道、LinkedIn求職頻道、Fox互動媒體社區(qū)網(wǎng)站等很多大網(wǎng)站的搜索引擎了。另外默多克傳媒、MySpace、Photobucket以及Rotten Tomatoes也都表示Hadoop為他們提供了很大的幫助。

在最近的一次采訪中,Hadoop創(chuàng)始人之一Doug Cutting表示自己都對Hadoop的發(fā)展速度感到吃驚。他說:“從Nutch(Hadoop的前身)開始探索網(wǎng)絡搜索以來,....我一直在尋找和挑戰(zhàn)突破”。還說;“那時候并沒有認為我們已經(jīng)超出了現(xiàn)在大規(guī)模網(wǎng)站的索引環(huán)境”。

但是在***個穩(wěn)定版本發(fā)布一年之后的幾個月里,也就是去年的ApacheCon會議上,關于Hadoop 1.0以及2010年的方向的討論變得不可思議。

該項目正朝著一個在無需打破用戶習慣、無需重新安裝軟件或損失數(shù)據(jù)的情況下就可以升級的目標前進。使用Hadoop,用戶在不需要徹底重建數(shù)據(jù)中心的情況下對系統(tǒng)進行升級。

Yahoo將Hadoop項目優(yōu)先級降低

Cutting說,他的前雇主,也就是Yahoo,這個擁有眾多支持者的企業(yè)一直都是Hadoop的唯一支持者。但是現(xiàn)在遇到了一些挑戰(zhàn),因為Yahoo已經(jīng)開始將重點傾斜向一些其他的項目了。搜索的另一個要求就是安全性,只有在安全的搜索保護下,人們才可以建設大規(guī)模私人信息集群,并且保證不讓其他人找到他們的信息。雖然安全也是Hadoop目標之一,但是Yahoo更希望能夠快速推出可用的產(chǎn)品。Cutting說,Hadoop 1.0可能沒有太大的改進,但是我們有很大的希望。

有趣的轉折

最初階段,Yahoo發(fā)起并推動了Hadoop項目,并為該項目提供了很大的幫助。但是在2000年之后,隨著Google公司的發(fā)展,Yahoo清楚的看到Hadoop不應該僅僅是一個網(wǎng)絡搜索引擎,更應該是一個能夠為分布式數(shù)據(jù)提供各種服務的運算架構。該架構是基于Google分布式文件系統(tǒng)(GFS)以及MapReduce之上。在GFS和MapReduce之前,也就是2002年的時候,Cutting已經(jīng)創(chuàng)建了Nutch這個很完善的搜索引擎,但是后來開始遇到困難。Cutting說,當時的工作內(nèi)容已經(jīng)涉及到整個互聯(lián)網(wǎng),對10億個網(wǎng)頁進行操作是一個很痛苦的事情。

從Nutch到Hadoop

Hadoop模仿GFS和MapReduce,將大量的數(shù)據(jù)分割成小的數(shù)據(jù)塊,以達到聯(lián)合數(shù)千個服務器快速搜索的目的,并且提供單一的訪問點。Cutting說,現(xiàn)在已經(jīng)能過搭建起基于20多臺服務器的演示案例,并在之上做一些實際的工作。但是不會達到所說的數(shù)千個服務器程度,因為那么多服務器,在可靠性方面現(xiàn)在還確實沒有辦法保證。

就在Yahoo參與和支持Nutch,并為該項目提供工程師和設備的時候,Yahoo軟件開發(fā)副總裁Eric Baldeschwieler發(fā)現(xiàn)了該項目的另一個用途,也就是迅速分析和處理位于多個網(wǎng)絡服務器上的數(shù)據(jù)。于是Cutting從Nutch中將分布計算部分單獨分離為Hadoop項目。

Cutting說Yahoo的研發(fā)人員希望從廣告以及web服務器獲取大量數(shù)據(jù)。如果你問一個Yahoo的研發(fā)人員如何提高廣告的相關性,他們會說首先把數(shù)據(jù)收集到一起,然后找到這些數(shù)據(jù)的早期用戶,這些人就是喜歡相關廣告的人。但是,如何分析網(wǎng)頁內(nèi)容幾周內(nèi)所發(fā)生的變化,這種變化每個小時都存在,并且會導致分散廣告點擊流量,以及如何在很短的時間內(nèi)處理上TB的數(shù)據(jù)。這些都是要處理的大問題在Yahoo將注意力放在安全問題上的時候,Cutting繼續(xù)為Hadoop項目尋找突破點。他希望有其他的非Java程序員能夠參與進來,參與的方式可以通過Avro項目。

Java之外

Avro是一種數(shù)據(jù)交換格式,目標是保證在應用程序升級或修改之后依然能對數(shù)據(jù)進行訪問。當然目標也包括Python、C、以及C++等其他程序語言能夠支持Hadoop、MapReduce 和 HDFS。

在2009年8月,Cutting加入了Cloudera公司,該公司的業(yè)務是銷售流行開源技術和服務。雖然Hadoop已經(jīng)應用在很多大型網(wǎng)站上,但是Cutting還是覺得Hadoop適合建立20個點左右的集群,這種集群應該比通過數(shù)據(jù)庫處理堆積如山的數(shù)據(jù)更容易。Cloudera的客戶包括NetFlix 和三星公司。

如果不希望在自己的企業(yè)里使用Hadoop,那么也可以像Amazon和Rackspace一樣,采用Hadoop提供云服務。雖然這樣做有點難,但是已經(jīng)有很好的支持工具了。Cutting還保證Hadoop的目標就是隱藏復雜的細節(jié),對外提供簡單的接口。

雖然現(xiàn)在Cutting還沒有確切的計劃,但是不會拖延Hadoop的推出。

【編輯推薦】

  1. Yahoo公布Hadoop的源代碼
  2. Bing、Google、Yahoo三強***大比拼
  3. 面向Java開發(fā)者的Yahoo富UI組件庫
  4. Yahoo推出新的陳列式廣告系統(tǒng)APT
  5. Yahoo發(fā)表Search Assist 強化搜索服務
責任編輯:佚名 來源: 51CTO
相關推薦

2010-06-07 12:52:21

Hadoop

2009-06-12 19:03:41

Hadoop源代碼Yahoo

2015-07-30 13:02:39

微軟Windows 10

2012-11-12 10:13:09

2015-07-17 11:08:13

GoogleOpenStack

2012-11-15 10:55:36

服務器數(shù)據(jù)中心Google

2011-10-17 09:26:48

微軟Hadoop

2016-08-22 12:52:41

GoogleFuchsia操作系統(tǒng)

2021-02-24 16:05:42

技術研發(fā)內(nèi)存

2009-06-01 09:46:57

2009-09-03 10:52:13

Google Wave

2015-11-30 14:01:31

應用交付網(wǎng)絡優(yōu)化

2015-01-19 10:51:45

GoogleStackdriver云計算

2021-08-27 15:19:14

AI技術科學

2012-02-13 09:03:04

Web

2024-09-29 18:25:34

金融數(shù)據(jù)數(shù)據(jù)倉庫數(shù)據(jù)飛輪

2012-04-29 16:01:39

Phone

2010-09-16 10:46:47

2012-05-03 15:16:36

華為

2013-05-02 10:17:34

Google AppsOffice 365
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产日韩欧美二区 | 婷婷综合五月天 | 在线观看亚洲一区二区 | 亚洲欧美v | 毛片免费看 | 日本人麻豆| 91av视频在线观看 | 久久综合国产精品 | 成人在线播放 | 欧美综合一区二区 | 99久久久久| 一区二区在线不卡 | 看羞羞视频 | a级片在线观看 | 天天躁日日躁狠狠很躁 | 福利视频一二区 | 久久在线看 | 最新免费av网站 | 日韩小视频在线 | 国产精品一区二区三级 | 国产午夜精品一区二区 | 人人干人人草 | 日本久久精品视频 | 久久精品亚洲一区 | 亚洲欧美日韩精品 | 精品欧美一区二区中文字幕视频 | 欧美激情视频网站 | 成人免费视屏 | 成人a网| 91精品久久久久久久久久入口 | 青青草原精品99久久精品66 | 久久成人精品视频 | 全免费a级毛片免费看视频免费下 | 亚洲激情综合网 | 成人国内精品久久久久一区 | 国产一区二区三区免费观看在线 | 免费性视频 | 国产色婷婷久久99精品91 | 日韩欧美中文 | 91新视频| 亚洲激情在线观看 |