成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

快扔掉MapReduce,擁抱Spark吧!

譯文
數(shù)據(jù)庫 Spark
Apache Spark也許能為Hadoop MapReduce帶來一套速度表現(xiàn)更出色的替代方案。

Apache軟件基金會正式宣布Spark的首個生產(chǎn)發(fā)行版本已經(jīng)準(zhǔn)備就緒,這款分析軟件能夠大大加快作業(yè)在Hadoop數(shù)據(jù)處理平臺上的運行速度。

作為擁有“Hadoop瑞士軍刀”美譽的軟件項目,Apache Spark能夠幫助用戶創(chuàng)建出性能卓越的數(shù)據(jù)分析作業(yè),其運行速度相較原本運行在標(biāo)準(zhǔn)Apache Hadoop MapReduce上的水平能夠高出上百倍。

取代Mapreduce

目前業(yè)界對于MapReduce持廣泛批評態(tài)度,認(rèn)為它在執(zhí)行作業(yè)時采取的批處理方式屬于Hadoop集群中的性能瓶頸所在——這同時意味著實時數(shù)據(jù)分析機制根本無法實現(xiàn)。

Spark的出現(xiàn)為MapReduce提供了一套理想的替代方案,它以五秒或者更短時間為周期、通過微批量爆發(fā)方式執(zhí)行處理作業(yè)。它還提供比Twitter Storm等實時、面向流的Hadoop框架更為出色的穩(wěn)定性表現(xiàn)。

Cloudera宣布拋棄MapReduce,擁抱Spark

2014年4月25日,Cloudera正式宣布拋棄MapReduce,投入Spark的懷抱。

51CTO為此專訪了前Intel研究院,現(xiàn)Databricks研究員連城。連城老師表示,理論已經(jīng)證明MapReduce模型可以模擬一切分布式計算(但未必可以高效模擬)。Spark基于RDD的計算圖可以輕松、完整地表達MapReduce模型,而且由于對分布式數(shù)據(jù)共享做了更高效的抽象,其效率比MapReduce只高不低。更多內(nèi)容請閱讀專訪原文>>

Spark可以被用于處理多種作業(yè)類型,其中包括實時數(shù)據(jù)分析、配合軟件庫實現(xiàn)更深層次的計算作業(yè)——例如機器學(xué)習(xí)與圖形處理。

利用Spark,開發(fā)人員可以通過Java、Scala或者Python等語言進行數(shù)據(jù)分析作業(yè)編寫,并使用超過80種高級運算符。

Spark 1.0帶來的變革

在1.0版本當(dāng)中,Apache Spark目前能夠提供穩(wěn)定的API(即應(yīng)用程序編程接口),開發(fā)人員可以利用它將自己的應(yīng)用程序與Spark相對接。已有的標(biāo)準(zhǔn)庫也得到了很大程度上的增強。

Spark 1.0版本中的另一項新特性是提供用于訪問結(jié)構(gòu)化數(shù)據(jù)的Spark SQL組件,它允許用戶在分析工作中同時對結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)進行查詢。

Apache Spark與Hadoop的分布式文件系統(tǒng)(簡稱HDFS)全面兼容,同時還能夠與其它Hadoop組件——包括YARN(全稱為Yet Another Resource Negotiator)以及HBase分布式數(shù)據(jù)庫——并行協(xié)作。

什么是Spark

Spark最初是由加利福尼亞大學(xué)伯克利分院的AMP(即算法、機器與人)實驗室開發(fā)而成的,Apache則于2013年6月將其納入了孵化器培養(yǎng)項目。目前包括Cloudera、Pivotal、IBM、英特爾以及MapR在內(nèi)的多家IT廠商都已經(jīng)將Spark引入自己的Hadoop堆棧。作為一家由部分Spark開發(fā)人員建立起來的公司,Databricks專門負(fù)責(zé)為該軟件提供商業(yè)支持服務(wù)。

除了前面提到的企業(yè),雅虎與美國宇航局還利用該軟件執(zhí)行日常數(shù)據(jù)操作任務(wù)。

與其它所有Apache軟件一樣,Apache Spark同樣基于Apache License 2.0版本。

原文鏈接:

http://www.itworld.com/420977/apache-lights-fire-under-hadoop-spark

【延伸閱讀】

2014年WOT全球軟件技術(shù)峰會上,將會專門安排Spark實時計算專場。來自INTEL、阿里的Spark技術(shù)專家將為大家?guī)矸窒怼S信d趣的同學(xué),可以掃描51CTO官方微信參與搶票活動。

責(zé)任編輯:彭凡 來源: 51CTO
相關(guān)推薦

2011-11-25 12:57:32

2017-04-19 11:17:48

SparkHadoopMapReduce

2020-07-21 15:00:49

Java 8并行流Java

2013-09-26 16:25:47

微軟甲骨文Windows Azu

2013-10-16 16:38:39

鏈表矩陣

2010-10-22 14:43:09

移動開發(fā)

2024-03-25 02:00:00

Vite開發(fā)

2019-10-10 16:20:23

spark內(nèi)存管理

2019-04-17 14:44:42

Spark內(nèi)存源碼

2020-12-07 05:50:54

print()Python代碼

2021-03-02 16:43:58

5G基站運營商

2020-05-13 09:42:28

91網(wǎng)快IT運維SDN

2016-11-02 09:20:01

SparkHadoop MapR大數(shù)據(jù)

2016-12-07 09:38:53

SparkMapReduce

2020-04-15 10:24:17

面試并發(fā)編程

2022-01-06 08:34:32

數(shù)據(jù)庫Spark查詢

2016-02-19 10:05:01

SparkMapReduce數(shù)據(jù)處理

2025-06-11 14:39:50

AILLMMistral

2020-10-09 10:20:39

碼農(nóng)代碼OpenAI

2017-06-28 11:12:49

戴爾超融合存儲
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 在线观看成年人视频 | 中文久久 | 欧美白人做受xxxx视频 | 青青艹在线视频 | 色噜噜狠狠色综合中国 | 亚洲免费视频在线观看 | 99久9| 日韩快播电影网 | 久久久久久久国产 | a在线视频 | 亚洲一区二区欧美 | 久久精品国产99国产精品 | 日本精品一区二区在线观看 | 亚洲国产精品一区二区第一页 | 久久一区 | 超碰97av | www.887色视频免费 | 亚洲h在线观看 | 91视频88av| 二区中文字幕 | 国产亚韩 | 国产综合久久 | 91超碰在线观看 | 久久精品毛片 | 黑人一级片视频 | 中文字幕 在线观看 | 最新国产精品视频 | 青青草综合网 | 日韩在线综合 | 亚洲天堂av在线 | 成人欧美一区二区三区白人 | 成人不卡视频 | 亚洲一区 | 久久久久久久久久毛片 | 日本免费在线观看视频 | 国产乱码精品1区2区3区 | 91免费视频 | 91精品久久久久久久久 | 成人深夜小视频 | 日本小电影在线 | 色吊丝2|