成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Facebook實時信息系統:HBase每月存儲1350億條信息

原創
數據庫 新聞
Facebook上的信息是海量的,這么大量的信息究竟有多少?具體的數字是每月1350億條。那么Facebook是如何存儲這些信息的呢?答案是HBase。

【51CTO經典譯文】也許你已經在一些地方看到這個消息,Facebook 已經開發一款新的社會化收件箱,集成了電子郵件、即時通訊、短信、文本信息、Facebook站內信息。最重要的是,他們需要每個月存儲 1350 億條信息。他們在哪里存儲這些信息?Facebook的Kannan Muthukkaruppan 在《信息背后的技術》一文中給出一個令人驚奇的答案:HBase。HBase 擊敗了MySQLCassandra和其他一些選項,成為了Facebook的選擇。

51CTO向您推薦《Facebook數據庫工具Flashcache初探

為什么這一選擇令人驚奇?Facebook 創建了Cassandra,其目的就是為了建造一個收件箱類型的應用程序,但是最終他們發現,Cassandra的一致性模型并不能很好地適用于Facebook 新的實時信息系統。另外,Facebook 還有一個擴展的MySQL 架構,不過他們發現,當數據集和索引變大時,性能會變得讓人無法忍受。另外,他們原本可以自己開發一套系統,但他們最終還是選擇了 HBase。

HBase是一個可以橫向擴張的表存儲系統,能夠為大規模數據提供速度極快的低等級更新。這正是信息系統所需要的功能。另外,HBase是一個基于列的鍵值存儲系統,并且是構建于 BigTabe 模型之上。HBase善于根據鍵訪問行,以及對于一系列的行進行掃描和過濾。同樣,這也是信息系統所需要的功能。不過,它并不支持復雜查詢。查詢通常交給分析工具處理,比如Hive,Facebook創建了Hive,目的是處理他們容量高達多個拍字節(petabyte)的數據倉庫。同時,Hive 是基于Hadoop的文件系統HDFS,而HBase使用的也是這一文件系統。

Facebook 選擇了HBase,因為他們對他們的應用進行了監視,并明白他們到底需要什么。他們所需要的是一個可以處理以下兩種類型的數據模式:

1. 一小組經常變化的臨時數據;

2. 一組不斷增加但很少訪問的數據。

這很有道理。當前收件箱里的郵件你只會看一次,之后你很少會再去翻看這些電子郵件。這兩種類似的數據是如此不同,所以有人也許在想應該使用兩種不同的系統。不過,很明顯,HBase 能夠很好地處理這兩種類型的數據。他們如何處理常規的搜索功能,尚不清楚,因為這并非 HBase 的優勢所在,不過,HBase 可以集成多個搜索系統。

Facebook 系統的一些關鍵點:

● HBase:

○ 具有比Cassandra更簡潔的一致性模型。

○ 對于他們的數據模式具有很好的擴展能力和處理能力。

○ 大多數功能能夠滿足他們的需求:自動加載平衡和故障轉移、壓縮支持功能、單個服務器的多碎片功能等。

○ HBase 所使用的文件系統HDFS,支持復制、端對端校驗和,以及自動再次平衡。

○ Facebook 的運營團隊具有豐富的HDFS使用經驗,因為Facebook是Hadoop的大用戶,而Hadoop使用 HDFS 作為它的分布式文件系統。

● Haystack 用于存儲附件。

● 從無到有,編寫可自定義的應用程序服務器,其目的是為了滿足多個不同來源流入的大量信息。

● 用戶發現服務(user discovery service)構建于 Zookeeper 之上。

● 對于以下功能可訪問架構服務:電子郵件賬號驗證、好友關系、隱私決策以及發送決策(通過聊天工具或短信發送一條消息?)

● 保持小團隊做大事情的一貫作風,15 位工程師在一年內發布了 20 項新的架構服務。

● Facebook將不會對單個數據庫平臺進行標準化,對于不同的任務他們將使用不同的平臺。

Facebook 通過選擇HBase將極大地推動該系統的采用,同時Facebook具有豐富的 HDFS/Hadoop/Hive 使用經驗。想到這些,就讓人興奮的無法入睡。這是任何一款產品的夢想:成為另一個非常流行的產品的搭檔,并期待成為其生態系統的一部分。這正是 HBase 所取得的成功。HBase 已經在許多方面去多了不錯的成績:實時、分布、線性擴展、健壯、BigData、開源、鍵值、面對列,我們將會看到 HBase 變得更加流行,尤其是它已經獲得了 Facebook 的眷顧和青睞。

原文標題:Facebook's New Real-Time Messaging System: HBase To Store 135+ Billion Messages A Month

相關閱讀

HBase是一個分布式的、面向列的開源數據庫,該技術來源于Chang et al所撰寫的Google論文“Bigtable:一個結構化數據的分布式存儲系統”。就像Bigtable利用了Google文件系統(File System)所提供的分布式數據存儲一樣,HBase在Hadoop之上提供了類似于Bigtable的能力。HBase是Apache的Hadoop項目的子項目。HBase不同于一般的關系數據庫,它是一個適合于非結構化數據存儲的數據庫.另一個不同的是HBase基于列的而不是基于行的模式。HBase使用和Bigtable非常相同的數據模型。用戶存儲數據行在一個表里。一個數據行擁有一個可選擇的鍵和任意數量的列。表是疏松的存儲的,因此用戶可以給行定義各種不同的列。HBase主要用于需要隨機訪問,實時讀寫你的大數據(Big Data)。

 

 

HBase架構圖

 

 

【編輯推薦】

  1. 開源數據庫Hibari發布 針對大數據量處理
  2. SQL Server數據庫對大數據量表數據進行DELETE
  3. MongoDB CEO談NoSQL的大數據量處理能力
  4. 詳解NoSQL數據庫使用實例
  5. 云計算時代NoSQL當道 關系數據庫日薄西山

 

責任編輯:彭凡 來源: 51CTO
相關推薦

2009-06-17 09:41:33

Facebook即時通FbChat

2020-09-22 07:00:00

事件驅動信息系統架構

2021-09-29 15:32:32

數據泄露漏洞信息安全

2020-04-21 11:56:42

Facebook數據泄露暗網

2021-01-25 12:25:49

物聯網智能冰箱IoT

2021-11-18 11:45:54

Stripchat漏洞信息泄露

2021-04-06 09:34:31

Facebook隱私黑客

2013-01-10 12:54:29

大數據探討Twitter

2020-04-22 15:10:45

信息泄露暗網網絡攻擊

2011-01-25 10:42:16

信息系統項目管理師

2014-12-09 13:09:02

華為存儲

2014-12-04 10:08:22

華為大數據存儲

2021-11-05 07:00:51

Facebook元宇宙人臉信息

2015-04-20 10:12:30

谷歌搜索

2017-01-12 16:54:04

信息泄露網絡安全房產商

2009-06-24 09:42:27

2012-10-10 22:02:35

2011-02-25 10:41:33

2011-07-18 11:13:30

2010-11-25 15:19:22

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲一区久久 | 欧美激情精品久久久久 | 伊人网综合在线 | 亚洲va国产日韩欧美精品色婷婷 | 欧美国产视频 | 欧美一区二 | 国产视频91在线 | 欧美激情一区 | 国产ts人妖一区二区三区 | 在线亚洲免费视频 | 久久久久久久夜 | 亚洲视频二 | 日本粉嫩一区二区三区视频 | 亚洲福利视频一区二区 | 丁香综合 | 午夜在线电影网 | 青青久久av北条麻妃海外网 | 亚洲丝袜天堂 | 久久99精品久久久久久国产越南 | 日韩视频―中文字幕 | 国产一区二区三区视频 | 欧美 日韩 中文 | 最新中文字幕在线 | 视频一区二区三区中文字幕 | 成人精品区 | 一级黄色播放 | 免费人成激情视频在线观看冫 | 日韩无| 国产亚洲人成a在线v网站 | 国产日韩一区 | 亚av在线 | 青青草网站在线观看 | 在线视频91 | 亚洲国产免费 | 国产精品自产av一区二区三区 | 成人小视频在线免费观看 | 国产精品日韩在线观看 | 国产高清久久久 | 欧美色欧美亚洲另类七区 | 亚洲一区二区三区欧美 | 三级在线观看 |