成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

開源大數(shù)據(jù)平臺實施和使用中的難點

大數(shù)據(jù)
開源大數(shù)據(jù)技術(shù)是一種新一代技術(shù)和構(gòu)架,它以成本較低、以快速的采集、處理和分析技術(shù),從各種超大規(guī)模的數(shù)據(jù)中提取價值。然而龐大的開源大數(shù)據(jù)技術(shù)體系,使得大數(shù)據(jù)平臺在實施和使用的過程中遇到很多難點。

開源大數(shù)據(jù)技術(shù)是一種新一代技術(shù)和構(gòu)架,它以成本較低、以快速的采集、處理和分析技術(shù),從各種超大規(guī)模的數(shù)據(jù)中提取價值。大數(shù)據(jù)技術(shù)不斷涌現(xiàn)和發(fā)展,讓我們處理海量數(shù)據(jù)更加容易、更加便宜和迅速,成為分析和挖掘海量數(shù)據(jù)價值的一個利器,甚至可以改變許多行業(yè)的商業(yè)模式。

龐大的開源大數(shù)據(jù)技術(shù)體系,使得大數(shù)據(jù)平臺在實施和使用的過程中遇到很多難點,Think Big團(tuán)隊總結(jié)了在開源大數(shù)據(jù)平臺設(shè)施的整個過程及花費(fèi)的時間,如下圖所示:

 

 

開源大數(shù)據(jù)平臺實施的難點

大數(shù)據(jù)平臺的優(yōu)化和運(yùn)維

大數(shù)據(jù)平臺的優(yōu)化和運(yùn)維應(yīng)該是開源大數(shù)據(jù)平臺實施的難點、也是構(gòu)建大數(shù)據(jù)平臺對人員的技術(shù)和經(jīng)驗要求***的階段,貫穿整個大數(shù)據(jù)平臺實施過程。

大數(shù)據(jù)平臺的數(shù)據(jù)整合、數(shù)據(jù)治理和數(shù)據(jù)湖

對于傳統(tǒng)的企業(yè)使用大數(shù)據(jù)平臺,數(shù)據(jù)整合、數(shù)據(jù)治理和數(shù)據(jù)湖也是非常重要和比較困難的階段,全公司不同數(shù)據(jù)源之間的數(shù)據(jù)整合面臨:數(shù)據(jù)的一致性、數(shù)據(jù)的完整性、數(shù)據(jù)的準(zhǔn)確性、數(shù)據(jù)的安全等問題如何解決,當(dāng)然還有不同數(shù)據(jù)(如:冷數(shù)據(jù)、溫數(shù)據(jù)和熱數(shù)據(jù))怎么來存放,進(jìn)而實現(xiàn)高效的數(shù)據(jù)存儲和分析。這些都是我們在大數(shù)據(jù)實施過程中需要花很多時間和經(jīng)驗來實現(xiàn)的,很多的公司基本上都在直接或間接的使用大數(shù)據(jù)技術(shù),有可能感覺大數(shù)據(jù)整合、治理、數(shù)據(jù)湖沒有那么重要,把功能實現(xiàn)了,就覺得把大數(shù)據(jù)平臺用的非常好了,其實不然,就像我上面提到的那張圖,功能的實現(xiàn)只占大數(shù)據(jù)平臺實施的一小部分。

大數(shù)據(jù)平臺上面的數(shù)據(jù)建模

由于大數(shù)據(jù)平臺面臨數(shù)據(jù)的一致性、數(shù)據(jù)的完整性、數(shù)據(jù)的準(zhǔn)確性等問題所以導(dǎo)致大數(shù)據(jù)平臺上面的建模變得比較困難,此外還有不同行業(yè)面臨的大數(shù)據(jù)平臺建模問題各不相同。傳統(tǒng)行業(yè)在大數(shù)據(jù)上面的建模面臨的挑戰(zhàn)還是非常多的,有的模型甚至不適合在開源大數(shù)據(jù)平臺上面建模,不要一味的去和互聯(lián)行業(yè)大數(shù)據(jù)平臺上面的應(yīng)用做比較,因為,互聯(lián)網(wǎng)的業(yè)務(wù)比傳統(tǒng)的業(yè)務(wù)模型簡單很多。

數(shù)據(jù)挖掘和算法的實現(xiàn)

大數(shù)據(jù)平臺的數(shù)據(jù)挖掘技術(shù)有Hadoop的Mahout、Spark的Mllib、SparkR等,這個現(xiàn)有的挖掘庫存在很多問題,如:分布式計算。對整個團(tuán)隊的人員要求非常的高。

應(yīng)用開發(fā)(類似于傳統(tǒng)EDW的BI功能)

類似于在Hadoop上面實現(xiàn)一個傳統(tǒng)的EDW的功能,常見用的比較多的就是SQL on Hadoop技術(shù),如:Hive、Impala、Tez、Presto、Kylin、SparkSQL等。

大數(shù)據(jù)平臺的選擇和搭建

主要是Apache Hadoop、Hortonworks HDP和Cloudera CDH的選擇,Apache Hadoop是純開源的,Hortonworks HDP是開源Hadoop生態(tài)系統(tǒng)的管理,Cloudera CDH是開源Hadoop生態(tài)系統(tǒng)的增強(qiáng)。

責(zé)任編輯:Ophira 來源: 36大數(shù)據(jù)
相關(guān)推薦

2019-04-08 17:16:43

大數(shù)據(jù)開源工具

2018-05-10 13:42:11

Hadoop架構(gòu)大數(shù)據(jù)

2016-08-03 16:34:23

企業(yè) 路徑 大數(shù)據(jù)

2021-02-10 16:03:19

大數(shù)據(jù)開源框架

2012-08-30 11:25:45

開源平臺谷歌Drill

2012-07-04 11:47:39

大數(shù)據(jù)開源

2023-09-11 12:57:00

大數(shù)據(jù)大數(shù)據(jù)中臺

2012-09-13 09:52:14

大數(shù)據(jù)數(shù)據(jù)應(yīng)用開源工具

2018-06-06 10:06:05

云計算大數(shù)據(jù)開源

2018-06-07 15:15:46

云計算 大數(shù)據(jù)

2022-03-10 14:53:12

大數(shù)據(jù)云計算IT

2017-07-13 11:13:18

大數(shù)據(jù)數(shù)據(jù)存儲

2012-03-21 11:11:37

ibmdw

2018-12-24 12:40:03

大數(shù)據(jù)IT互聯(lián)網(wǎng)

2015-08-10 09:23:05

2017-03-28 18:25:59

華為

2014-08-01 10:29:17

大數(shù)據(jù)業(yè)務(wù)模型

2023-08-04 16:22:09

大數(shù)據(jù)

2017-07-22 00:41:27

大數(shù)據(jù)數(shù)據(jù)存儲
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 粉嫩粉嫩芽的虎白女18在线视频 | 久久精品91| 97国产精品视频人人做人人爱 | 天堂一区在线 | 交专区videossex农村 | 国产综合久久久久久鬼色 | 亚洲精品久久久久久久久久久 | 午夜小影院 | 狠狠操狠狠干 | 亚洲成人黄色 | 国产精品久久久久久久久久免费 | 中文字幕免费中文 | 永久免费在线观看 | 色综合久 | 亚洲一区国产精品 | 日韩在线免费 | 国产午夜精品一区二区三区在线观看 | 色黄网站| 国产精品久久久久久久粉嫩 | 久草网址 | 国产精品成人一区 | 狠狠婷婷综合久久久久久妖精 | 新疆少妇videos高潮 | 午夜精品久久久久久久久久久久久 | 99免费在线观看 | 四虎永久免费黄色影片 | 国产一区二区影院 | www.欧美 | 人人操日日干 | 久久99精品久久久 | 婷婷在线视频 | 久久久久无码国产精品一区 | 亚洲高清视频在线观看 | 狠狠av| 一级毛片免费视频观看 | 亚洲福利一区二区 | 午夜精品一区二区三区在线播放 | 九九热在线免费视频 | 欧美日韩国产精品一区二区 | 亚洲美女视频 | 毛片入口|