成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何在云上實現(xiàn)大數(shù)據(jù)項目?

云計算
這是大多數(shù)人所認為的大數(shù)據(jù)的核心;它常常相當于開源項目 Hadoop。公司可能已被來自射頻 ID (RFID) 移動、網(wǎng)站點擊和其他可能結(jié)構(gòu)化的數(shù)據(jù)的要求所淹沒。如果您知道將如何使用這些數(shù)據(jù),如何在未來查詢和訪問它,那么在處理這些數(shù)據(jù)方面進行投資是值得的。

云計算和大數(shù)據(jù)目前都是熱門話題,如何把兩者結(jié)合起來即在云上實現(xiàn)大數(shù)據(jù)項目,這是一個新的實踐領域。資深數(shù)據(jù)專家David Gillman根據(jù)自己的經(jīng)驗,列舉了云上大數(shù)據(jù)方案需要考慮的基本要素,包括對數(shù)據(jù)構(gòu)建實時索引、自由模式搜索與分析、監(jiān)視數(shù)據(jù)并提供實時警告等,幫助用戶更好地評估和選擇解決方案。

在談到如何實現(xiàn)云上大數(shù)據(jù)項目時,David強調(diào)了三個實時要素,即實時索引、實時數(shù)據(jù)和實時監(jiān)控。具體來說,實時索引指的是“對所有機器數(shù)據(jù)創(chuàng)建通用的實時索引”:

這是大多數(shù)人所認為的大數(shù)據(jù)的核心;它常常相當于開源項目 Hadoop。公司可能已被來自射頻 ID (RFID) 移動、網(wǎng)站點擊和其他可能結(jié)構(gòu)化的數(shù)據(jù)的要求所淹沒。如果您知道將如何使用這些數(shù)據(jù),如何在未來查詢和訪問它,那么在處理這些數(shù)據(jù)方面進行投資是值得的。

您無需知道數(shù)據(jù)的未來潛在用途,Hadoop 提供了解決辦法。通過按原樣獲取傳入的數(shù)據(jù),大數(shù)據(jù)將數(shù)據(jù)定義步驟推遲到了執(zhí)行分析時。在不會限制數(shù)據(jù)的未來使用的情況下,Hadoop 將數(shù)據(jù)分布在許多服務器上并持續(xù)跟蹤數(shù)據(jù)位置。

實時數(shù)據(jù)指的是“對實時數(shù)據(jù)和歷史數(shù)據(jù)的自由搜索與分析”,存儲數(shù)據(jù)只是實現(xiàn)目標的道路的一部分。另一方面是信息需要相對容易地被找到。為此,最快的方法是提供一種快速(在實現(xiàn)方面,而不是響應時間方面)搜索功能。因此需要找到支持對非結(jié)構(gòu)化數(shù)據(jù)進行文本搜索的工具。從監(jiān)視程序上直接獲得響應,這會讓人們模糊地認為所有信息都被正確存儲且可以訪問。此過程的管理步驟是為存儲在分布式節(jié)點中的數(shù)據(jù)內(nèi)容建立索引。搜索查詢,然后并行訪問分布式節(jié)點上的索引,以便提供更快的響應。

實時監(jiān)控指的是“監(jiān)視數(shù)據(jù)并提供實時警告”:

尋找一個工具來監(jiān)視大數(shù)據(jù)中的數(shù)據(jù)。一些工具能夠創(chuàng)建被持續(xù)處理的查詢,尋找要滿足的條件。我無法列出實時監(jiān)視進入 Hadoop 中的數(shù)據(jù)的所有可能用法。假設大部分傳入數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),而且不適用于關系數(shù)據(jù)庫,那么實時監(jiān)視可能是最仔細地檢查數(shù)據(jù)元素的一種方式。

除了三個“實時"之外,Daivid還列舉了其他七個要點,可以歸納為:

自動從數(shù)據(jù)中發(fā)現(xiàn)有效的信息

執(zhí)行手動搜索和手動報告也會影響分析效率。 數(shù)據(jù)挖掘和預測分析工具正在快速向以下方向發(fā)展:能夠?qū)⒋髷?shù)據(jù)用作分析數(shù)據(jù)來源的數(shù)據(jù)庫,或者用作持續(xù)監(jiān)視變更的數(shù)據(jù)庫。所有數(shù)據(jù)挖掘工具都遵循此目標。某個人確定分析的用途,查看數(shù)據(jù),然后開發(fā)能提供洞察或預測的統(tǒng)計模型。然后,需要將這些統(tǒng)計模型部署在大數(shù)據(jù)環(huán)境中,以執(zhí)行持續(xù)評估。這部分操作應該是自動化的。

提供強大的特定報告和分析

類似于知識發(fā)現(xiàn)和自動化的數(shù)據(jù)挖掘,分析師需要獲得訪問能力來檢索和匯總大數(shù)據(jù)云環(huán)境中的信息。擁有大數(shù)據(jù)報告工具的供應商似乎每天都在增多。基于云的大數(shù)據(jù)提供商應同時支持來自外部請求者的 Pig 和 HQL 語句。這樣,大數(shù)據(jù)存儲即可由人們使用自己選擇的工具(甚至使用還未創(chuàng)建的工具)來查詢。

提供快速構(gòu)建自定義儀表板和視圖的能力

像傳統(tǒng)的商業(yè)智能項目的演化一樣,當人們可以查詢大數(shù)據(jù)并生成報告時,他們希望自動化該功能并創(chuàng)建一個儀表板,以便通過漂亮的圖片反復查看。除非人們編寫自己的 Hive 語句和僅使用 Hive shell,大部分工具都有使用查詢語句創(chuàng)建類似儀表板的視圖的能力。要在大數(shù)據(jù)部署中列舉許多儀表板示例,目前還為時過早。一種基于商業(yè)智能歷史的預測是,儀表板將成為已匯總的大數(shù)據(jù)的一個重要的內(nèi)部傳遞工具。而且從商業(yè)智能的歷史發(fā)展來看,擁有良好的大數(shù)據(jù)儀表板對于獲取和保持高層領導支持至關重要。

使用普通硬件進行高效擴展,以支撐任何數(shù)據(jù)量

當使用云大數(shù)據(jù)服務時,此考慮因素更沒有多少實際意義。采購、配備和部署用于存儲數(shù)據(jù)的硬件是服務提供商的職責。硬件的選擇應該不難。但是,值得欣慰的是,賬單表明大數(shù)據(jù)適合使用普通硬件。在架構(gòu)中的一些節(jié)點上,“高質(zhì)量的” 服務器很有用。但是,大數(shù)據(jù)架構(gòu)中絕大部分節(jié)點(存儲數(shù)據(jù)的節(jié)點)都可放在 “更低質(zhì)量的” 硬件上。

提供細粒度、基于角色的安全和訪問控制

當非結(jié)構(gòu)化數(shù)據(jù)位于關系數(shù)據(jù)中時,訪問數(shù)據(jù)的復雜性可能會阻礙人們獲取數(shù)據(jù)。常見的報告工具不起作用。考慮采用大數(shù)據(jù)是簡化復雜訪問的一個有效步驟。不幸的是,同樣的安全設置通常無法從現(xiàn)有關系系統(tǒng)遷移到大數(shù)據(jù)系統(tǒng)上。使用的大數(shù)據(jù)越多,良好的安全性就會變得越重要。最初,安全保護可能很少,因為沒有人知道如何處理大數(shù)據(jù)。隨著公司開發(fā)出了更多使用大數(shù)據(jù)的分析,需要對結(jié)果(尤其是報告和儀表板)進行保護,這類似于保護來自當前關系系統(tǒng)的報告。 開始使用基于云的大數(shù)據(jù),了解需要在何時應用安全性。

支持多租戶和靈活的部署

云的使用帶來了多租戶的概念,但這顯然不是內(nèi)部大數(shù)據(jù)環(huán)境中的考慮因素。許多人對將關鍵數(shù)據(jù)放在云環(huán)境中感到不安。而重要的是,云提供了開始實現(xiàn)大數(shù)據(jù)項目所需的低成本和快速部署。正是由于云提供商將數(shù)據(jù)放在了具有共享的硬件資源的架構(gòu)中,成本才會顯著降低。上帝是公平的,將數(shù)據(jù)放在您的服務器上,由其他某個人來管理整個設置也未嘗不可。但是,在大數(shù)據(jù)需求是間歇性的時候,這不是一個經(jīng)濟高效的業(yè)務模型。結(jié)果會產(chǎn)生更高的開支,因為公司將為大量空閑時間付費,尤其在實現(xiàn)***個項目期間,在分析師探索、考慮和了解大數(shù)據(jù)的時候。

集成API并通過它們進行擴展

大數(shù)據(jù)是為供自定義應用程序訪問而設計的。常見的訪問方法使用 RESTful應用編程接口 (API)。這些 API 可用于大數(shù)據(jù)環(huán)境中的每個應用程序,用于管理性控制、存儲數(shù)據(jù)和報告數(shù)據(jù)。因為大數(shù)據(jù)的所有基礎組件都是開源的,所以這些 API 經(jīng)過了全面地說明并且可以廣泛使用。希望基于云的大數(shù)據(jù)提供商允許訪問目前和未來的所有具有適當安全保護的 API。

責任編輯:王程程 來源: CIO時代網(wǎng)
相關推薦

2015-03-17 16:02:16

大數(shù)據(jù)混合云云模型

2016-01-26 10:02:18

GitHub大數(shù)據(jù)開源

2014-08-15 09:09:32

大數(shù)據(jù)

2017-01-20 09:08:28

大數(shù)據(jù)路線應用

2016-03-21 18:56:54

物聯(lián)網(wǎng)IoTIT基礎架構(gòu)

2014-12-10 10:51:54

OpenStackSahara云計算

2023-10-13 13:11:26

大數(shù)據(jù)技術開源

2015-08-03 10:40:15

云計算大數(shù)據(jù)開源

2018-04-15 21:39:04

大數(shù)據(jù)項目應用

2019-05-23 09:50:46

大數(shù)據(jù)IT人工智能

2022-06-30 21:08:25

大數(shù)據(jù)數(shù)據(jù)湖數(shù)據(jù)倉庫

2023-05-10 16:04:38

大數(shù)據(jù)架構(gòu)

2016-12-13 19:40:00

大數(shù)據(jù)

2021-10-26 06:43:36

大數(shù)據(jù)傳統(tǒng)企業(yè)

2014-06-06 09:52:42

大數(shù)據(jù)

2013-07-26 10:24:32

大數(shù)據(jù)項目大數(shù)據(jù)IT

2017-03-14 15:43:39

大數(shù)據(jù)項目Hadoop

2017-04-05 15:32:42

大數(shù)據(jù)項目問題

2017-12-11 11:48:56

大數(shù)據(jù)項目數(shù)據(jù)集成

2024-01-31 16:36:53

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久操伊人 | 黄视频免费| 一区二区久久 | 久久爱黑人激情av摘花 | 日韩精品一区二区三区四区 | 在线观看黄色电影 | 综合久久一区 | 久久久久久黄 | 日韩久久久久 | 亚洲国产精品区 | 黑人巨大精品欧美一区二区免费 | 热99视频 | 成人免费黄色片 | 亚洲性在线 | 国产农村一级国产农村 | 欧美精品在欧美一区二区少妇 | 久久久久99| 台湾佬久久 | 亚洲免费在线播放 | 中文字幕高清av | 色女人天堂 | 国产激情综合五月久久 | av中文网 | 日韩精品成人网 | 超碰97人人人人人蜜桃 | 国产综合久久 | 精精国产xxxx视频在线野外 | 成人福利影院 | 情侣av | 久久久精| 午夜影院网站 | 日韩一区二区三区视频 | 精品视频一区二区三区在线观看 | 欧美日本在线观看 | 久久九九影视 | 中国一级大毛片 | 99热在线播放 | 国产精品久久久久久久午夜片 | 欧美日韩高清 | 国产精品99久久久久久动医院 | 日本字幕在线观看 |