成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Google將放棄MapReduce 新索引系統將遷移至BigTable

開發 前端 大數據
據國外媒體報道,Google將在新型絡內容索引系統——Caffeine中放棄使用MapReduce分布式計算平臺,而準備向Google新建的分布式數據庫平臺——BigTable上進行遷移。

據國外媒體報道,Google在新型網絡內容索引系統——Caffeine中,將放棄以MapReduce為基礎架構的分布式計算平臺。MapReduce是曾經是Google的一項重要技術,用以進行大數據量的計算。

據Google高級主管Eisar Lipkovitz表示,在Caffeine中,Google的后端索引系統將從MapReduce上移除,并向Google新建的分布式數據庫平臺——BigTable上進行遷移。他表示,谷歌將于下月在USENIX研討會上提交一項新的文件討論系統。

51CTO向您推薦:Bigtable探秘 Google分布式數據存儲系統

據了解,從去年開始,Google就已經啟動了代號為“Colossus”的研發計劃,主要內容圍繞新的分布式文件系統——Caffeine進行研發。Caffeine將創建一個新的數據庫的編程模型,而這也意味著Google必須在BigTable上重建整個索引系統。

MapReduce完成歷史使命

必須看到的是,在Google的直接競爭對手——Yahoo、Facebook們對MapReduce飽含熱情進行研發投入的同時,Google卻宣布放棄MapReduce,不得不佩服Google的勇氣。

實際上,早在Caffeine建立之前,Google就建立了基于MapReduce的搜索索引系統。從本質上而言,這個索引是由序列的批處理操作組成的。它通過把對數據集的大規模操作分發給網絡上的每個節點進行運算,而每個節點會周期性的把完成的工作和狀態的更新報告回主計算。

Lipkovitz首先談到了Google基于MapReduce文件索引系統處理方式。“我們必須面對一個非常龐大的數據系統,在這之前,我們需要等待8個小時的計算時間我們才能夠得到計算的全結果,然后我們就會把它發布到索引系統中去。過去我們一直在不停地重復這個耗時耗力的工作。”

Lipkovitz進一步解釋了Google放棄MapReduce的原因,“MapReduce僅僅是一個批處理操作方式,”Lipkovitz解釋說,“一般來說你不能啟動下一階段的命令操作,直到你完成第一項操作。”

可以看到,Google之所以放棄MapReduce,是因為它并不能為谷歌提供它所想要的索引速度,特別是隨著實時檢索時代的到來,谷歌需要的是在幾秒內刷新索引內容,而非8小時。實際上,在過去的幾年里,針對MapReduce的技術討論可謂是褒貶不一。

麻省理工學院的數據庫專家Mike Stonebraker認為,MapReduce的計算方法對于實時計算來說是很不合適的,是過時的。

“MapReduce就像是游擊隊員而非正規軍”,Lipkovitz表示,“如果你想基于Mapreduces建立分布式文件處理系統,如果你想實現更多的操作命令,那么必然會有錯誤發生。況且你并不能縮短處理的時間,這是Google選擇放棄Mapreduces的原因。”

Caffeine的處理原理

Caffeine的處理原理

據了解,Google從2009年8月就開始測試Caffeine。當時,Google曾表示新索引技術將是自2006年以來的重大變革。速度和綜合性是新技術關注的目標。Google曾表示,新系統需與網絡內容的爆炸性增長保持同步,過去兩年中,博客、視頻和社交媒體技術都蜂擁至網絡。借助Caffeine,Google將加快索引次數的更新,對一小部分網絡進行消化,而不是對整個網絡重新索引并更新索引內容。

Google軟件工程師卡莉·格蘭姆斯(Carrie Grimes)在博客中稱:“我們將把Caffeine列為未來考慮重點,不僅使之索引更多新結果,還要將之打造為適應網絡消息增長的速度更快、理解力更高的搜索引擎,為用戶提供相關度更高的搜索結果。”

關于“Colossus”計劃

“我們需要一個新的計算框架”,Lipkovitz說,這使工程師能夠在BigTable上編寫代碼,而該系統是基于“Colossus”建立的分布式存儲平臺——也被稱為GFS2。“原有的基于MapReduce的文件系統,不能達到Google所需要的計算規模。”

據了解,“Colossus”是專門設計BigTable的開發計劃,基于這個原因,它并不針對傳統的分布式存儲平臺應用。換句話說,它是專為建立新的Caffeine搜索索引系統而用的,雖然它可能會在Google的其它內容所服務,但其并未跨越整個谷歌的基礎設施系統。

在Google的實時搜索引擎Instant的發布上,谷歌著名的工程師Ben Gomes表示,Caffeine并未在Instant架構中,但它的確有助于幫助把數據處理實現“分布”式搜索服務。

Lipkovitz同時指出,MapReduce并非意味著消亡,在Caffeine中,仍然有基于MapReduce的批處理應用,以及全球尚有其它的基礎設施。而在Caffeine的誕生之前,索引系統是谷歌最大的MapReduce的應用程序。

關于MapReduce

在Google數據中心會有大規模數據需要處理,比如被網絡爬蟲抓取的大量網頁等。由于這些數據很多都是PB級別,導致處理工作不得不盡可能的并行化,而Google為了解決這個問題,引入了 MapReduce這個編程模型,MapReduce是源自函數式語言,主要通過"Map(映射)"和"Reduce(化簡)"這兩個步驟來并行處理大規模的數據集。

Map會先對由很多獨立元素組成的邏輯列表中的每一個元素進行指定的操作,且原始列表不會被更改,會創建多個新的列表來保存Map的處理結果。也就意味著,Map操作是高度并行的。當Map工作完成之后,系統會先對新生成的多個列表進行清理(Shuffle)和排序,之后會這些新創建的列表 進行Reduce操作,也就是對一個列表中的元素根據Key值進行適當的合并。

通過MapReduce這么簡單的編程模型,不僅能用于處理大規模數據,而且能將很多繁瑣的細節隱藏起來,比如自動并行化,負載均衡和機 器宕機處理等,這樣將極大地簡化程序員的開發工作。MapReduce可用于包括“分布grep,分布排序,web訪問日志分析,反向索引構建,文檔聚 類,機器學習,基于統計的機器翻譯,生成Google的整個搜索的索引“等大規模數據處理工作。Yahoo也推出MapReduce的開源版本 Hadoop,而且Hadoop在業界也已經被大規模使用。

原文鏈接:http://www.theregister.co.uk/2010/09/09/google_caffeine_explained/

【編輯推薦】 

  1. 如何實現Cassandra與Hadoop MapReduce的整合?
  2. Hadoop簡介:HDFS和MapReduce的實現
  3. Hadoop MapReduce的簡單應用Cascading詳解
  4. HadoopStudio中實現MapReduce應用
責任編輯:王曉東 來源: CSDN
相關推薦

2012-05-13 14:15:49

2018-07-31 09:02:15

開發者技能Google

2021-09-23 10:30:21

Docker RegiHarborLinux

2021-12-22 10:45:56

Docker RegiHarborLinux

2016-08-31 14:16:55

LinuxLVM卷轉移

2009-04-15 09:12:10

AndroidAPIgoogle

2016-03-30 11:31:30

AWS云環境

2009-04-15 08:18:44

AndroidGoogle移動OS

2020-08-11 11:08:24

云端云計算業務遷移

2012-11-06 10:41:14

2010-07-02 10:08:12

BigtableGoogle

2009-04-07 08:35:05

AndroidGoogle移動OS

2016-11-18 12:30:28

Android谷歌操作系統

2011-11-09 16:15:21

AdobeFlashAdobe AIR

2012-10-29 09:27:16

2010-07-07 09:50:52

Windows Ser

2017-01-18 09:34:29

數據庫云環境

2012-05-30 16:54:18

Google

2009-09-02 11:34:09

Google App

2009-09-03 10:52:13

Google Wave
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一区二区视屏 | 国产精品国产精品 | 日日av| 国产免费a | 久久人人网 | 国产精品一区一区三区 | 国产粉嫩尤物极品99综合精品 | 在线看av网址| 午夜精品久久久久99蜜 | 伊人亚洲 | 日本高清精品 | 中国一级特黄毛片大片 | 日韩高清不卡 | 国产精品久久久久无码av | 日韩中文一区二区三区 | 国产黄色电影 | 伊人艹 | 精品视频一二区 | 亚洲一区二区三区免费观看 | 日韩精品在线看 | 亚洲精品1区 | 操久久| 欧美一区二区三区在线免费观看 | 青青草精品视频 | 国产传媒视频在线观看 | 日本不卡高清视频 | 国产在线观看一区二区 | 久久99蜜桃综合影院免费观看 | 色在线免费视频 | 久久国产美女视频 | 日韩一区二区在线视频 | 97人人澡人人爽91综合色 | 蜜桃特黄a∨片免费观看 | 中文字幕 亚洲一区 | 久久日韩精品一区二区三区 | 成人一区二区三区 | 国产成人在线一区二区 | 免费一区二区 | 久久中文字幕一区 | 日韩激情免费 | 日本免费小视频 |