成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大數(shù)據(jù)主流工具,你知道幾個?

大數(shù)據(jù)
業(yè)內(nèi)有這樣一種說法,SQL雖然在大數(shù)據(jù)分析領(lǐng)域久經(jīng)考驗,但是無奈長江后浪推前浪,和炙手可熱的Hadoop相比,SQL已經(jīng)過時了。

業(yè)內(nèi)有這樣一種說法,SQL雖然在大數(shù)據(jù)分析領(lǐng)域久經(jīng)考驗,但是無奈長江后浪推前浪,和炙手可熱的Hadoop相比,SQL已經(jīng)過時了。這個說法有點言過其實,現(xiàn)在很多的項目都是將Hadoop作為數(shù)據(jù)存儲,然后利用SQL進(jìn)行前端查詢。這說明Hadoop需要一種高級查詢語言的支持。 Hadoop MapReduce雖然能夠進(jìn)行數(shù)據(jù)分析,但是太復(fù)雜了。于是,開發(fā)人員開發(fā)出了類似SQL的Pig和Hive。

大數(shù)據(jù)時代,我們有很多的查詢工具可以選擇。雖然SQL占據(jù)著絕對優(yōu)勢,但是隨著大數(shù)據(jù)的持續(xù)升溫,也給了Apache Pig和Hive很大的發(fā)揮空間。工欲善其事必先利其器,如果選擇了合適的平臺和語言,會讓數(shù)據(jù)的提取,處理和分析達(dá)到事半功倍的效果。未來,數(shù)據(jù)會越來越大,數(shù)據(jù)分析必須要更易操作。處理速度快和操作簡單必定成為大數(shù)據(jù)分析的主流趨勢。

Apache Pig,Apache Hive和SQL是當(dāng)今主流的大數(shù)據(jù)工具。它們各有優(yōu)勢,下面我們就先來簡單介紹Apache Pig、Apache Hive和SQL。

 SQL

結(jié)構(gòu)化查詢語言(SQL)是程序員的最佳伴侶,主要用于處理和提取數(shù)據(jù)。大數(shù)據(jù)改變了數(shù)據(jù)處理和可視化的方式。但是SQL嚴(yán)格的關(guān)系數(shù)據(jù)庫模式和聲明特性依然是數(shù)據(jù)分析的標(biāo)桿。盡管SQL市場廣闊,但是大數(shù)據(jù)也對SQL的功能和性能提出了挑戰(zhàn)。

Pig

Apache Pig適合有SQL背景的程序員學(xué)習(xí),其有以下兩個特點:

1.放寬了對數(shù)據(jù)存儲的要求

2.可以操作大型數(shù)據(jù)集

Apache Pig是雅虎在2006年開發(fā),除了上述特點,它還有很好的可擴(kuò)展性和性能優(yōu)化。 Apache Pig允許開發(fā)人員跟蹤多個查詢方法,從而降低了數(shù)據(jù)的重復(fù)檢索。它支持復(fù)合數(shù)據(jù)類型(Map、Tuple、Bag),支持常見的數(shù)據(jù)操作,例如篩選、排序和Join。Apache Pig的這些特性得到了世界各地用戶的認(rèn)可,就連雅虎和推特也采用了Apache Pig。

Hive

盡管Apache Pig性能優(yōu)異,但是它要求程序員要掌握SQL之外的知識。Hive和SQL非常相似,雖然Hive查詢語言(HQL)有一定的局限性,但它仍然是非常好用的。Hive為MapReduce提供了很好的開源實現(xiàn)。它在分布式處理數(shù)據(jù)方面表現(xiàn)很好,不像SQL需要嚴(yán)格遵守模式。

數(shù)據(jù)的提取、處理和分析沒有一個萬全之策,需要綜合多種因素來選擇,例如數(shù)據(jù)存儲方法,編程語言結(jié)構(gòu)以及預(yù)期的結(jié)果。下面我們就來對比一下Pig、Hive和SQL,看看它們各自都適合什么樣的場景。

Pig VS SQL

SQL在DBMS系統(tǒng)的運行速度要比MapReduce(Pig運行在PigLatin平臺)快。然而,RDBMS的數(shù)據(jù)加載很具挑戰(zhàn),設(shè)置困難。 PigLatin在聲明式執(zhí)行計劃、ETL流程和管道修改方面更有優(yōu)勢。

在很大程度上,SQL是聲明式語言,而PigLatin是過程語言。SQL主要是指定完成的對象,即要完成“什么”,而Pig主要是制定完成的方式,即“如何”執(zhí)行一個任務(wù)。在執(zhí)行之前,Pig腳本要轉(zhuǎn)化成MapReduce任務(wù)。不過,Pig腳本比相應(yīng)的MapReduce任務(wù)要短,顯著縮短了開發(fā)時間。

Hive VS SQL

SQL是一個被廣泛用于事務(wù)性和分析查詢的通用數(shù)據(jù)庫語言。而Hive是以數(shù)據(jù)分析為目標(biāo)而設(shè)計的,這也決定了Hive會缺少更新和刪除功能,但是讀取和處理海量數(shù)據(jù)的能力會很強。Hive和SQL是非常相似的,最主要的區(qū)別就是Hive缺少更新和刪除功能。

盡管Hive和SQL有所區(qū)別,但是如果你有SQL背景,就可以平穩(wěn)過渡到Hive。另外,一定要注意兩者在結(jié)構(gòu)和語法上的差異。

相信大家通過上面對Pig、Hive和SQL的介紹,對它們都有了一定的了解,下面我們就來介紹一下它們的具體適用場景。

Apache Pig的適用場景

Apache Pig適用于非結(jié)構(gòu)化的數(shù)據(jù)集,可以充分利用SQL。Pig無需構(gòu)建MapReduce任務(wù),如果你有SQL學(xué)習(xí)的背景,那么入門會非常快。

Apache Hive的應(yīng)用場景

很多企業(yè)都需要對歷史數(shù)據(jù)進(jìn)行分析,Hive就是一款分析歷史數(shù)據(jù)的利器。但是Hive只有在結(jié)構(gòu)化數(shù)據(jù)的情況下才能大顯神威。Hive的軟肋是實時分析,如果想要進(jìn)行實時分析,可以采用HBase。

SQL的應(yīng)用場景

SQL是三者之中資歷最老的數(shù)據(jù)分析工具,隨著用戶需求的不斷變更,SQL也在不斷的自我更新,現(xiàn)在仍然是一個與時俱進(jìn)的工具。對專業(yè)的數(shù)據(jù)分析師來說,毫無疑問,SQL比Excel要強,但是,它在快速處理和分析數(shù)據(jù)方面仍然存在著短板。如果數(shù)據(jù)要求不是很苛刻,SQL是一個很好的選擇,它的廣泛性和靈活性得到了開發(fā)人員的認(rèn)可。因為絕大數(shù)的開發(fā)人員都熟悉SQL,所以可以馬上上手,同時SQL還提供了一些擴(kuò)展和優(yōu)化功能,可以根據(jù)需求來定制產(chǎn)品。

現(xiàn)在還沒有任何一個工具可以適用所有的數(shù)據(jù),SQL、Pig和Hive都有各自的適用場景,所以適合自己應(yīng)用場景的工具就是最好的工具。

責(zé)任編輯:趙寧寧 來源: 大數(shù)據(jù)觀察
相關(guān)推薦

2021-07-25 21:20:34

大數(shù)據(jù)IT工具

2023-04-27 08:15:09

2020-04-08 16:41:18

大數(shù)據(jù)Hadoop工具

2024-02-26 00:00:00

前端工具Space.js

2019-05-10 11:13:19

分析工具Java

2024-12-04 10:08:05

2021-07-31 23:13:29

大數(shù)據(jù)數(shù)據(jù)分析技術(shù)

2021-05-06 15:15:13

Python工具代碼

2022-01-19 09:03:01

工具

2022-04-15 09:01:18

前端工具UTF8編碼

2018-01-02 09:31:12

大數(shù)據(jù)數(shù)據(jù)互聯(lián)網(wǎng)

2023-11-13 15:36:24

開源數(shù)據(jù)庫

2019-11-12 08:53:32

PG數(shù)據(jù)數(shù)據(jù)庫

2021-11-30 09:11:48

數(shù)據(jù)泄露勒索軟件攻擊

2024-03-27 14:35:09

自動驗證工具

2024-11-04 08:49:11

2020-04-03 18:43:21

大數(shù)據(jù)Hadoop數(shù)據(jù)

2024-01-18 00:16:07

2021-10-12 09:20:02

數(shù)據(jù)庫SQL腳本

2021-02-27 17:13:21

前端代碼邏輯
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲人在线观看视频 | 97精品超碰一区二区三区 | 六月成人网 | 红桃视频一区二区三区免费 | 久久久久一区二区三区 | 国产精品爱久久久久久久 | 日韩视频一区二区三区 | 亚洲精品一区二区三区丝袜 | 91免费电影| 久久青视频 | 一区二区三区国产好 | 日韩在线播放网址 | 在线激情视频 | 久久精品一 | 野狼在线社区2017入口 | 网站国产 | 中文天堂在线观看 | 99精品欧美一区二区三区 | 国产一级一级毛片 | 久久精品青青大伊人av | 欧美中文字幕在线 | 免费a级毛片在线播放 | 午夜av毛片 | 国产成人a亚洲精品 | 色婷婷综合成人av | 午夜影院在线免费观看视频 | 精品国产乱码久久久久久a丨 | 在线观看国产wwwa级羞羞视频 | 亚洲国产中文字幕 | 自拍偷拍中文字幕 | 欧美日一区| 午夜视频在线免费观看 | 亚洲精品片 | 婷婷综合久久 | 国产清纯白嫩初高生视频在线观看 | 欧美视频免费在线观看 | 国产激情91久久精品导航 | www.日日夜夜| 亚洲区视频 | 日本亚洲一区 | 亚洲有码转帖 |