成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大數(shù)據(jù)相關(guān)開源系統(tǒng)簡介匯總

大數(shù)據(jù)
本片博客介紹大數(shù)據(jù)相關(guān)的開源系統(tǒng)以及他們對應(yīng)的一句話簡介, 對于各位想大概了解大數(shù)據(jù)都有哪些開源系統(tǒng)的同學(xué)有幫助。

如下是Apache基金支持的開源軟件

  1. hdfs
     
    跟GFS類似, 一個(gè)分布式文件系統(tǒng)。
     
  2. mapreduce
     
    跟Google的MapReduce類似, 一個(gè)典型的簡單的分布式計(jì)算框架。
     
  3. yarn
     
    資源管理系統(tǒng), 跟Mesos類比。
     
  4. Avro
     
    跟PB類似, 用于將數(shù)據(jù)結(jié)構(gòu)序列化成字節(jié)碼, 在不同的語言之間切換。
     
    官方舉例是將C轉(zhuǎn)換給Pig。
     
  5. BigTop
     
    一個(gè)給Hadoop打包和測試的軟件。其本來是cloudera公司自己給自己寫的一個(gè)方便OP部署和搭建環(huán)境的工具, 不過因?yàn)閷懙貌诲e(cuò), 已經(jīng)成為了Apache***項(xiàng)目。目前支持系列Hadoop生態(tài)鏈中的軟件: Zookeeper, Flume, HBase, Pig, Hive, Sqoop, Oozie, Whirr, Mahout, SolrCloud, Crunch, DataFu and Hue
     
  6. Chukwa
     
    收集各種實(shí)時(shí)監(jiān)控?cái)?shù)據(jù)(比如日志)并固化到HDFS上的事情。
     
  7. Drill
     
    Google的Dremel的開源版本。PB以上數(shù)據(jù)實(shí)時(shí)秒級查詢。
     
  8. Flume
     
    用來做數(shù)據(jù)遷移的工具。支持?jǐn)?shù)據(jù)包括Avro, files, 系統(tǒng)日志, 落地的系統(tǒng)包括HDFS, HBase。
     
  9. HBase
     
    Google的BigTable的開源版本。寬列存儲, 底層基于HDFS。
     
  10. HCatalog
     
    為HDFS做的一個(gè)管理metadata的系統(tǒng)?;贖ive, 提供服務(wù)給MapReduce, Pig, 將來會(huì)支持HBase。
     
  11. Hive
     
    支持HSQL, 將SQL轉(zhuǎn)換成MapReduce任務(wù)。
     
  12. Mahout
     
    一個(gè)數(shù)據(jù)挖掘, 機(jī)器分析的算法庫。
     
  13. Oozie
     
    用來管理Hadoop中的多輪任務(wù)的工具, 類似DAG管理工具。
     
  14. Tez
     
    也是多個(gè)任務(wù)的DAG管理工具, 但是其做得更底層,直接替代了MR的調(diào)度程序,多個(gè)任務(wù)之間的數(shù)據(jù)傳遞不用再落地到hdfs上了。
     
  15. Pig
     
    跟Hive類似, 提供比裸寫MR更友好的界面, 然后翻譯成MapReduce。只是Hive提供的是SQL, Pig提供的是更高級別的語言Pig-Latin, 供用戶做數(shù)據(jù)挖掘和分析。
     
  16. Sqoop
     
    Sql-to-Hadoop。將關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)導(dǎo)入到Hadoop當(dāng)中。
     
  17. ZooKeeper
     
    提供高可用的存儲服務(wù)。內(nèi)部采用paxos一致性協(xié)議。
     
  18. Whirr
     
    用于將Hadoop放到各種IaaS里面去運(yùn)行的環(huán)境部署類項(xiàng)目。
     
  19. Crunch
     
    用來管理Hadoop/Spark上面的Pipeline的軟件。應(yīng)該是比Pig/Hive更低一個(gè)級別的抽象, 提供數(shù)據(jù)的join/aggregation的Java API。
     
  20. DataFu
     
    為Pig而準(zhǔn)備的系列數(shù)據(jù)挖掘算法軟件包。
     
  21. Hue
     
    Hadoop的漂亮平臺化界面。

如下是非Apache組織的一些項(xiàng)目

  1. Spark
     
    支持迭代式計(jì)算。將MapReduce的一輪一輪計(jì)算的概念轉(zhuǎn)換成同一批數(shù)據(jù)不停處理的概念, 并提供高級語言。
     
  2. Shark
     
    Hive On Spark。即支持HSQL。
     
  3. Impala(Cloudera)
     
    另一個(gè)Google的Dremel的開源版本, 界面跟Hive類似(事實(shí)上就是使用的Hive-SQL的子集), 只是不是翻譯成MapReduce而是直接查詢。
     
  4. Sentry(Cloudera)
     
    在Hive/Impala之上獨(dú)立的一層專門做認(rèn)證授權(quán)的系統(tǒng)。
     
  5. SolrCloud
     
    Solr+Hadoop, Big Data Search。

 

責(zé)任編輯:李英杰 來源: cnblogs
相關(guān)推薦

2018-02-23 16:38:58

2012-07-04 11:47:39

大數(shù)據(jù)開源

2019-02-20 23:06:56

大數(shù)據(jù)數(shù)據(jù)語言

2012-09-13 09:52:14

大數(shù)據(jù)數(shù)據(jù)應(yīng)用開源工具

2019-04-08 17:16:43

大數(shù)據(jù)開源工具

2013-08-14 09:48:02

微軟REEF

2023-11-24 08:02:28

2018-06-05 12:06:20

Hadoop開源工具

2014-04-29 09:59:44

2018-06-06 15:00:27

開源大數(shù)據(jù)大數(shù)據(jù)項(xiàng)目

2016-09-27 21:35:28

BossiesSparkTensorFlow

2012-04-01 14:57:46

2011-04-01 10:35:16

BlackBerry BlackBerry

2009-08-07 18:07:58

C#數(shù)據(jù)庫開發(fā)

2011-04-22 10:53:13

Unix哲學(xué)

2013-05-22 14:02:34

2018-11-19 12:58:47

大數(shù)據(jù)技術(shù)Java

2022-08-22 11:34:42

開源數(shù)據(jù)

2022-08-01 11:08:35

自動(dòng)駕駛數(shù)據(jù)

2023-11-27 09:49:37

自動(dòng)駕駛數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲欧美日韩精品久久亚洲区 | 国产亚洲精品久久午夜玫瑰园 | 精品国产精品一区二区夜夜嗨 | 青青久视频 | 精品欧美一区二区在线观看视频 | 久久av在线播放 | 9191在线播放 | 中文字幕日本一区二区 | 久久九 | 精品久久影院 | 欧美四虎 | 亚洲在线| 97色在线视频 | 国产精品久久国产精品久久 | 中文字幕日韩三级 | 免费观看黄 | 日日夜夜天天综合 | 国产超碰人人爽人人做人人爱 | 欧美成人手机视频 | 欧美午夜影院 | 色婷婷综合久久久中文字幕 | 中文字幕在线电影观看 | 欧美亚洲一区二区三区 | 成人精品视频99在线观看免费 | 欧美老少妇一级特黄一片 | 黄色毛片一级 | 欧美国产日韩一区二区三区 | 精品久久久久久中文字幕 | 久久99精品久久久久久秒播九色 | 羞羞的视频在线看 | 国产成人jvid在线播放 | 中文字幕精品一区二区三区精品 | 中文字幕电影在线观看 | 91一区 | 99免费在线视频 | 欧美区日韩区 | 亚洲激情一级片 | 色资源在线观看 | 一级毛片在线播放 | 毛片大全| 日韩欧美精品 |