成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Twitter將采用Spark分析大數(shù)據(jù)

大數(shù)據(jù) Spark
Twitter數(shù)據(jù)科學(xué)家Edwin Chen最近在接受媒體采訪的時(shí)候透露,Twitter內(nèi)部希望嘗試一種全新的大數(shù)據(jù)系統(tǒng)——Spark。

 Spark是一個(gè)基于內(nèi)存計(jì)算的開(kāi)源的集群計(jì)算系統(tǒng)(點(diǎn)此下載),目的是讓數(shù)據(jù)分析更加快速。Spark非常小巧玲瓏,由加州伯克利大學(xué)AMP實(shí)驗(yàn)室的Matei為主的小團(tuán)隊(duì)所開(kāi)發(fā)。使用的語(yǔ)言是Scala,項(xiàng)目的core部分的代碼只有63個(gè)Scala文件,非常短小精悍。與Hadoop不同的是,Spark和Scala緊密集成,Scala像管理本地collective對(duì)象那樣管理分布式數(shù)據(jù)集。

Edwin認(rèn)為:”MapReduce或hadoop任務(wù)都是批處理,所以啟動(dòng)一項(xiàng)Hadoop任務(wù),或等待結(jié)果返回都需要等待很長(zhǎng)時(shí)間,這一點(diǎn)很難改變,因?yàn)镠adoop天生就是一個(gè)批處理系統(tǒng),你無(wú)法在上面運(yùn)行互動(dòng)分析。不過(guò)Hadoop對(duì)于分析海量數(shù)據(jù)還是很有用的。”

Spark開(kāi)發(fā)之初是為了兩個(gè)能被內(nèi)存計(jì)算提速的應(yīng)用:互動(dòng)算法(常見(jiàn)于機(jī)器學(xué)習(xí)中,例如Google的PR)和互動(dòng)數(shù)據(jù)挖掘(Hive on Spark)。在這兩個(gè)應(yīng)用中,Spark的速度是Hadoop MapReduce的30倍!這是因?yàn)檫\(yùn)行Spark系統(tǒng)時(shí),服務(wù)器可以把中間數(shù)據(jù)存儲(chǔ)在RAM內(nèi)存中,而無(wú)需經(jīng)常從頭加載。這意味著分析結(jié)果的返回速度大大加快,足以勝任互動(dòng)分析工作。(見(jiàn)下圖)

spark-lr

在Spark的出生地——加州伯克利大學(xué)的AMP實(shí)驗(yàn)室,研究人員用Spark分析垃圾郵件過(guò)濾、自然語(yǔ)言處理以及交通路況預(yù)測(cè)等任務(wù)。Spark還被用來(lái)給Conviva、Klout和Quantifind等公司的數(shù)據(jù)分析服務(wù)提速。無(wú)疑,Spark處理分布式數(shù)據(jù)集的框架不僅是有效的,而且是高效的(通過(guò)簡(jiǎn)潔的Scala腳本)。Spark和Scala目前都還尚處于開(kāi)發(fā)中。盡管如此,隨著加入更多的關(guān)鍵互聯(lián)網(wǎng)特性,它越來(lái)越從有趣的開(kāi)源軟件過(guò)渡為基礎(chǔ)的web技術(shù)。

責(zé)任編輯:彭凡 來(lái)源: IT經(jīng)理世界
相關(guān)推薦

2013-05-14 10:01:57

Luchy Sort

2013-05-14 09:17:14

Twitter大數(shù)據(jù)Lucky Sort

2017-11-06 14:48:01

大數(shù)據(jù)法醫(yī)犯罪

2020-03-24 15:16:09

Salesforce大數(shù)據(jù)Einstein An

2017-10-19 08:28:15

大數(shù)據(jù)HadoopSpark

2012-12-06 10:59:51

大數(shù)據(jù)

2013-08-01 09:09:39

大數(shù)據(jù)

2013-04-19 14:28:07

大數(shù)據(jù)

2023-06-05 05:39:35

大數(shù)據(jù)

2017-10-11 11:10:02

Spark Strea大數(shù)據(jù)流式處理

2009-03-03 11:31:21

Twintter集成搜索

2014-03-27 09:36:36

Spark

2014-05-27 16:23:46

Twitter開(kāi)放數(shù)據(jù)

2013-05-09 09:35:00

Cloudmeter大數(shù)據(jù)

2018-04-17 09:03:01

SparkRDD大數(shù)據(jù)

2022-04-02 09:32:06

大數(shù)據(jù)數(shù)據(jù)智能企業(yè)

2020-06-23 14:12:23

大數(shù)據(jù)IT技術(shù)

2021-03-15 14:02:21

大數(shù)據(jù)數(shù)據(jù)開(kāi)發(fā)Spark

2020-12-24 15:00:50

物聯(lián)網(wǎng)大數(shù)據(jù)數(shù)據(jù)分析

2013-01-10 12:54:29

大數(shù)據(jù)探討Twitter
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 亚洲精品电影在线 | av综合站| 999在线精品 | 一区二区三区欧美在线 | 91精品在线观看入口 | 妞干网av | 国产中文字幕在线观看 | av在线播放免费 | 成年人免费网站 | 国产精品伦一区二区三级视频 | 国产一级免费视频 | 久久免费视频观看 | 国产一区二区在线播放 | 天天操天天射综合 | 日韩在线观看一区 | 国产精品久久99 | 国产欧美在线一区二区 | 美女精品一区 | 999热在线视频 | 欧美成人一区二区三区 | 日本精品久久久久久久 | 国产一区二区不卡 | 成人一区二区三区 | 国产精品久久久久久av公交车 | 国产成人久久av免费高清密臂 | 91视频大全 | 天天爽夜夜爽精品视频婷婷 | 国产在线一级片 | av一区在线| 欧美日韩在线不卡 | 天天干国产 | 久久99深爱久久99精品 | 嫩草国产 | 亚洲欧美中文日韩在线v日本 | 91国自产| 国产高清精品在线 | 久久99视频这里只有精品 | 视频在线亚洲 | 国产精品一区二区三区在线 | 国产免费一区二区 | 美美女高清毛片视频免费观看 |