成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

企業選擇數據湖架構的5大理由

大數據 數據湖
隨著大數據的重要性和接受度的提高,人們也越來越需要考慮如何組織和托管大數據。答案之一是數據湖,在數據準備和組織方面最廣泛的數據體系結構系統。

隨著大數據的重要性和接受度的提高,人們也越來越需要考慮如何組織和托管大數據。答案之一是數據湖,在數據準備和組織方面最廣泛的數據體系結構系統。

 

[[278749]]

簡單地說,它允許企業首先存儲數據,然后在需要時檢索數據。就像一個存儲單元,你只是把你的東西存儲,并在未來需要的時候找出來。

這種方法與傳統的數據倉庫截然不同,傳統的數據倉庫需要對數據進行結構化,且通常在記錄數據之前采用類似表格的形式。數據倉庫是一種固定形式的解決方案,它不是敏捷的,同時意味著額外的重新配置成本。但迄今為止,它一直是全球企業的首選。

那么,將數據湖作為數據管理選項的主要原因有哪些?

削減成本

因為在存儲數據之前不需要設計數據的模式,所以沒有前期的開發費用。且處理數據湖的Hadoop系統是開源的,因此沒有額外的軟件許可成本。

與傳統數據倉庫的不同之處在于,有了數據湖,ETL階段就完全沒有了。您不必知道存儲在湖中的數據類型或者有多少字段。刪除ETL過程意味著沒有與許可、維護或增長數據結構相關的成本。

敏捷性

添加新單元或單個新項目可能會改變現有的整個數據結構,從而引發額外的成本。此外,進行這些更改所需的實現時間可能從幾天到幾周不等。

在數據湖中,所有的數據都已經存儲,并且只有很少的變化,您可以隨時查詢。

這種方法幫助企業在當今不斷變化的數據世界中保持敏捷性。未來幾年里可能會出現新的數據格式,其中一些甚至是現在還無法預見的。因此,企業數據存儲系統需要足夠靈活,在不進行重大結構更改的情況下滿足所有既定和突發要求。

多種格式

數據湖可以處理各種數據格式。即使數據湖中的一些數據看起來與其他數據無關,但從整體的角度進行組合和分析時,它可以提供基本的業務見解。

例如,如果一個數據湖包含關于客戶的記錄,比如姓名、年齡、去年的支出,以及客戶在網上商店的行為統計圖,很難看出這些細節和銷售線索之間的直接聯系。然而,把所有的東西放在一起,可以發現一定年齡的客戶往往會更快地做出購買決定,這可能會影響銷售策略。

除了多種格式,還有關于數據源的上下文透視圖。最常見的資源包括面向客戶的應用程序、BI應用程序、銷售日志等。物聯網的興起將增加數據源和格式的數量,使數據湖成為唯一可靠的解決方案。

人工智能

由于數據湖使用非結構化數據,因此不適合使用傳統的基于sql的工具進行查詢。相反,由于大多數數據都具有合適的3v(體積、速度、多樣性),因此可以將其視為大數據并用于訓練人工智能算法。

實際上,擁數據湖的目標是讓信息實時(或幾乎實時)準備好進行處理。這種動態的方法為公司提供了立即反應的機會。將所有數據放在同一個位置意味著在分析之前檢索數據的時間更少。

靈活性和規模

數據湖最典型的特性可能是其可伸縮性和靈活性,它可以適應企業數據的任何變化,而不需要對基礎設施進行重大更改。由于整個架構是基于云的,通常通過按使用量付費的業務模型進行訪問,所以任何升級或降級都意味著只需更改您的支付計劃。

這種靈活性與不能實時修改的遺留系統形成了對比。數據湖可以很容易地添加或合并數據。就像是現實中的湖泊,它可以由多條河流匯集,并且可以隨時添加新的河流,而不會干擾之前的設置。與此同時,遺留系統就像一個裝水設施,任何改變都需要更多的瓶子、更多的標簽和重新安排時間。

局限

盡管數據湖有很多優勢,但也并不是萬無一失的解決方案,也絕對不是萬能藥。數據湖最大的風險在于,它們可能會變成數據沼澤,數據可能會被毫無意義地丟棄。

所有保存的數據流都應該與項目中的kpi和業務目標相結合。避免信息癱瘓的一種方法是創建可視化儀表板,通過儀表板,數據可以被正確顯示,即使不是數據庫學家也可以理解數據。

責任編輯:未麗燕 來源: IT168企業級
相關推薦

2013-09-25 09:58:33

必應

2013-10-25 14:17:58

SAP

2020-02-09 10:11:10

物聯網大數據傳感器

2014-07-11 13:56:16

2013-09-16 10:28:05

企業PC桌面操作系統

2020-02-26 13:59:28

JavaScript物聯網編程語言

2011-08-01 17:16:06

WindowsEC7嵌入式

2016-09-29 14:39:01

openSUSELinux版本

2013-01-08 14:07:28

2010-11-19 15:59:51

IT跳槽

2010-08-11 14:40:42

IBM DB2

2009-06-22 15:02:47

StrutsJSF

2012-10-12 14:44:40

微軟Office

2018-02-10 09:48:04

存儲軟件理由

2010-09-13 10:31:29

CSS布局

2013-01-23 10:58:04

2018-04-03 10:18:53

數據

2011-12-08 09:39:27

HTML 5

2018-03-30 08:42:07

數據中心整合戰略
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品888| 亚洲一级毛片 | 国产精品亚洲视频 | 国产日韩欧美在线观看 | 国产亚洲欧美另类一区二区三区 | 91成人精品 | 精品免费av | 瑟瑟视频在线看 | 日日综合 | 欧美精品中文字幕久久二区 | 91精品国产一区二区三区香蕉 | 国产成人精品高清久久 | 一级毛片免费完整视频 | 精品国产一区二区久久 | 久久久久精| 中文字幕一区二区三区四区五区 | h视频在线观看免费 | 成人免费视频观看视频 | 亚洲精品九九 | 另类亚洲视频 | 欧美一区二区三区 | 天天久 | 看一级黄色毛片 | 黄色一级视频免费 | www.亚洲一区二区 | 国产视频在线观看一区二区三区 | 天天操一操 | 国产精品欧美一区二区三区不卡 | 男女羞羞免费视频 | 国产亚洲网站 | 成人在线观看中文字幕 | 国产精品色一区二区三区 | 国产精品一区二区三区四区 | 国产精品视频久久久 | 精品视频一区二区三区 | 久久精品小短片 | 免费1区2区3区 | 91在线免费视频 | 久久久久一区 | 欧美11一13sex性hd | 看特级黄色片 |