成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

為什么你的大數據項目瞬間就”涼”了?

大數據
企業正努力在產品中部署大數據,這一點是毋庸置疑的。但是,根據Gartner在2016年下半年發布的新聞稿:只有15%的企業將其大數據項目部署到生產中。“Gartner在選詞時非常謹慎,這并不意味著剩下的企業沒有實踐,或者數據科學家沒有發現使用大數據技術的優勢,只是剩下的85%的項目并沒有真正投入生產。

企業正努力在產品中部署大數據,這一點是毋庸置疑的。但是,根據Gartner在2016年下半年發布的新聞稿:只有15%的企業將其大數據項目部署到生產中。“Gartner在選詞時非常謹慎,這并不意味著剩下的企業沒有實踐,或者數據科學家沒有發現使用大數據技術的優勢,只是剩下的85%的項目并沒有真正投入生產。 

[[224619]]

問題不在于缺少大數據分析或者是大量的數據科學實驗。真正的挑戰是缺乏大數據自動化能力,以便將實驗版本從沙箱推入功能齊全的生產環境中。

大多數人認為分析生產就是調整集群。當然,可以編寫一個sqoop腳本并將表格放入一次。但是,在不影響源系統的情況下多次實現則是一個挑戰。然后,必須確保構建的數據管道在由服務級別協議(SLA)設置的時間范圍內提供數據。此外,數據模型需要針對用戶當前正在使用的工具(如Tableau,Qlik等)進行優化,以達到用戶所期望的響應能力。

在Hadoop和Spark之上使用工具進行大量的努力和改進以對大型數據集進行快速原型設計。但原型是一回事,創建每天運行而不發生故障的數據工作流程,或者在數據流作業失敗時自動啟用恢復,又是另外一回事。

本文作者分析了五大大數據項目夭折最常見的技術原因:

1、無法快速加載數據以滿足SLA

雖然像sqoop這樣的工具支持數據讀取的并行化以從傳統數據源獲取數據到數據湖,但需要專家來使其正常工作。如何劃分數據?要運行多少個容器等問題都需要專家給出合適的解決方案。如果無法正確處理并行數據的讀取,則一個小時就可完成的任務甚至需要10到20倍的時間,因為大多數人不知道如何正確調整。

2、不能逐步加載數據以滿足SLA

大多數企業并未將整個操作轉移到大數據環境中。他們從現有的操作系統移動數據以執行新的分析或機器學習,這意味著需要在新數據到達時繼續加載。問題是這些環境不支持添加,刪除或插入的概念,這意味著必須重新加載整個數據集(請參閱上面的第1點),否則必須圍繞一次更改捕獲問題編寫代碼。

3、不能以交互方式提供對數據報告的訪問權限

想象一下,如果有1000位商業智能分析師,他們都不想使用您的數據模型,因為他們需要很長時間才能查詢。這是Hadoop的一個經典問題,也是許多公司僅使用Hadoop進行預處理和應用特定機器學習算法,但隨后將最終數據集移回傳統數據倉庫以供BI工具使用的原因。無論如何,這個過程又為成功完成大數據項目增加了難度。

4、不能從測試遷移到生產

許多企業能夠確定沙箱環境中數據科學家的新見解的潛力。一旦他們確定采納新的分析方法,就需要從沙盒轉移到生產環境。從開發轉移到生產是一個完整的升降和換擋操作,通常是手動完成的。雖然它在開發集群上運行良好,但現在相同的數據管道必須在生產集群上重新優化。這種調整往往需要大量的返工才能有效執行。如果開發環境與生產環境有任何不同,則情況尤其復雜。

5、不能管理端到端的生產工作量

大多數企業都將注意力集中在工具上,因此他們的數據分析師和科學家可以更輕松地識別新的方法。但是,他們沒有投資類似的工具來運行生產環境中的數據工作流程,因此不得不擔心啟動、暫停和重新啟動過程,還必須擔心確保作業的容錯性,處理通知以及協調多個工作流以避免“沖突”。

因為上述五大技術原因,導致很多大數據項目并沒有如期與我們見面。

責任編輯:未麗燕 來源: IT168
相關推薦

2018-04-11 09:50:04

大數據

2019-05-23 09:50:46

大數據IT人工智能

2023-05-10 16:04:38

大數據架構

2013-07-26 10:24:32

大數據項目大數據IT

2017-03-14 15:43:39

大數據項目Hadoop

2020-03-24 17:49:27

大數據IT技術

2018-04-15 21:39:04

大數據項目應用

2016-05-18 11:47:35

Apache大數據項目開源

2014-08-15 09:09:32

大數據

2022-06-30 21:08:25

大數據數據湖數據倉庫

2016-08-05 09:51:25

GPU大數據

2016-03-21 18:56:54

物聯網IoTIT基礎架構

2014-12-10 10:51:54

OpenStackSahara云計算

2013-04-22 10:00:53

云計算大數據

2023-10-13 13:11:26

大數據技術開源

2016-01-26 10:02:18

GitHub大數據開源

2016-12-13 19:40:00

大數據

2017-12-11 11:48:56

大數據項目數據集成

2017-04-05 15:32:42

大數據項目問題

2013-09-24 10:53:39

Gartner大數據項目
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲欧洲激情 | 亚洲成av片人久久久 | 在线a视频| 亚洲高清在线观看 | 久久国产精品无码网站 | 成人欧美一区二区三区黑人孕妇 | 色橹橹欧美在线观看视频高清 | 无码日韩精品一区二区免费 | 成人精品鲁一区一区二区 | 一区二区三区在线免费观看 | 亚洲精品片 | 中文字幕日韩欧美 | 一区二区在线 | 岛国毛片| caoporn国产 | 日韩中文一区 | 插插插干干干 | 欧美一级高潮片免费的 | 喷潮网站 | 亚洲欧美v | 一区二区三区视频在线观看 | 国产91 在线播放 | 99久久精品国产毛片 | 91久久精品日日躁夜夜躁国产 | 91久久夜色精品国产网站 | 国产精品2区 | 91视视频在线观看入口直接观看 | 成人免费视频网站在线看 | 国产精品美女久久久久久久网站 | 国产精品久久久久久久久久久久冷 | 涩涩视频在线观看 | 青春草在线 | 国产传媒毛片精品视频第一次 | 成人午夜激情 | 亚洲国产一区二区视频 | 蜜桃av人人夜夜澡人人爽 | 亚洲精品一区二区网址 | 国产精品福利久久久 | 狠狠干天天干 | 日韩av手机在线观看 | 天天操网|