成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何讓Hadoop運行得更快一些?

運維 系統運維 Hadoop
在數據處理方面,我們發現數據輸入速度一般要比的數據處理速度快很多,這種現象在大數據領域尤為明顯。隨著數據不斷膨脹,相應的響應時間自然要有所增加,數據處理的復雜度也在不斷提高。對于Hadoop來說,如何提升它的速度呢?來看看下文。

在數據處理方面,我們發現數據輸入速度一般要比的數據處理速度快很多,這種現象在大數據領域尤為明顯。隨著數據不斷膨脹,相應的響應時間自然要有所增加,數據處理的復雜度也在不斷提高。作為一個開發者,我們自然非常關注系統的運行速度問題。在云計算領域,一個小技巧也許能帶來系統性能的大幅度提升。對于Hadoop來說,如何提升它的速度呢?來看看下文。

Hadoop是用以下的方式來解決速度問題:

1 使用分布式文件系統:這使得負載分攤,并壯大系統

2 優化寫入速度:為了獲得更快的寫入速度,Hadoop架構是設計成先寫入記錄,然后在進行處理

3 使用批處理(Map/Reduce)來平衡數據傳送速度和處理速度。

批處理所帶來的挑戰

批量處理的挑戰在于,數據必須要間斷性地進入才能保證流程正常運作,而如果數據源連續地輸入,就會造成系統崩潰。

如果我們增加批處理窗口的話,結果就會增加數據處理過程的時間,使得相關的數據分析報告也要推遲落入我們的手中。在許多系統里,他們會選擇在非高峰時間進行數據批處理,而這個時間是非常有限的。隨著數據的體積不斷脹大,處理數據的時間就不斷增加,這樣發展下去的話,需要被處理的數據就會不斷積壓。這最終的結果有可能一天都處理不完數據。

通過流處理來提升速度

流處理的概念是非常簡單的。我們并不需要等到所有數據記錄完后才進行處理,我們可以邊記錄邊處理。

拿生產線來做比喻,我們可以等到所有的組件齊全后才開始裝配汽車,也可以在生產廠那邊把組件包裝好,然后再送到特定的生產線,并馬上組裝起來。不用說,你也知道哪個速度會更快一點吧。

數據處理就跟生產線一樣,而流處理進程就是把數據包裝起來,并送到特定的“生產線”上。而在傳統行業上,即使生產商把所有的部件都預裝起來,我們依然需要一條生產線來組裝。同樣,流處理并不是要取代Hadoop,它只是用于減少系統大量工作,從而提升系統的處理速度。

Curt Monash在他的“傳統數據庫最終會在RAM中終結”的研究中指出的,內存間的流處理能夠打造出更好的流處理系統。下面就是一個實時大數據的分析案例,并用Twitter來演示數據的相應處理方式。

Google更快的處理方案:用流處理來替代Map/Reduce

由于當時缺乏可替方案,即使Map/Reduce性能不佳,許多大數據系統依然要使用這個技術。一個***的應用例子就是使用這項技術來維護全球的搜索索引。現在Google在索引處理方面大大減少使用Map/Reduce,反而加入了實時處理模式,這使得索引速度縮短為原來的一百分之一。

在網絡中,一些類型的數據在不斷膨脹。這也是HBase為什么計入觸發式處理的原因,而Twitter未來將要處理更龐大的流數據。

***的啰嗦

為了提升速度,在數據抵達Hadoop系統之前,我們可以通過一些預處理來提升系統的速度。我們也能像Google一樣,在某些情況下使用流處理方案來替代Map/Reduce。

責任編輯:黃丹 來源: 雷鋒網
相關推薦

2024-10-08 10:24:41

Python編程語言

2012-09-06 09:36:17

谷歌NatiShalom數據處理

2018-11-12 15:35:51

華為云

2022-06-22 10:33:06

麻省理工大學PaShUnix shell

2023-09-20 00:06:30

Python代碼函數

2019-03-29 09:00:11

Windows 10PC模擬器

2020-09-04 15:03:18

Python代碼語言

2023-06-26 07:21:41

標題欄鼠標標題

2021-12-14 12:10:41

ChromeWindows瀏覽器

2022-05-05 09:31:58

JOIN數據庫

2023-10-11 07:33:39

Z-indexCSS

2023-09-04 16:55:18

2017-04-06 09:00:39

Windows 7Windows磁盤碎片

2016-11-11 20:33:53

Hadoop大數據云計算

2020-09-28 18:01:43

開發彩色代碼

2020-09-27 14:43:37

開發工具技術

2009-06-22 15:36:00

如何學好java

2020-05-19 08:06:57

代碼重構代碼開發

2017-09-18 18:31:08

Hadoop

2009-11-13 08:53:01

Windows 7BIOS優化
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 天堂综合网久久 | 亚洲视频免费在线观看 | 久久爱一区 | 九九热这里 | 欧美成人一区二区三区 | www.99热这里只有精品 | 毛片99| 久久久999精品 | 亚洲成人网在线 | 一区二区三区四区不卡视频 | 欧美v片| 亚洲成人黄色 | 97精品超碰一区二区三区 | 免费在线观看黄色av | 国产乱码精品一品二品 | 日韩一区二区三区在线视频 | a视频在线观看 | 亚洲国产一区二区三区在线观看 | 欧美精品1区2区3区 免费黄篇 | 国产一区二区 | 三级黄色片在线播放 | 99视频在线播放 | 狠狠插天天干 | 999热视频| 成人午夜免费福利视频 | 久久久资源 | 中文字幕一区二区三区精彩视频 | 精品av天堂毛片久久久借种 | 欧美色综合 | 成人av一区二区亚洲精 | 久久久久久99| av男人的天堂在线 | 欧美激情精品久久久久久免费 | 免费成人高清在线视频 | 中文字幕一页二页 | 欧日韩在线| 欧美精品久久久 | 久久不卡日韩美女 | 国产粉嫩尤物极品99综合精品 | 国产成人精品久久二区二区91 | 美女视频h |