成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

巧用云平臺簡化Spark集群與大數據部署

譯文
數據庫 Spark
在本屆Spark 2014峰會上,Databricks公司CEO Ion Stoica在主題演講中公布了Databricks云——這是一套針對內存內集群計算的交鑰匙平臺,承諾以Hadoop MapReduce為基礎給大數據處理任務帶來顯著性能提升。

在日前于舊金山舉辦的Spark 2014峰會上,Databricks公司CEO Ion Stoica通過主題演講公布了Databricks云——這是一套以Apache Spark開源處理引擎為核心構建而成的云平臺,專門負責大數據處理工作。

Spark項目在一個月之前才剛剛完成了其v1.0版本,這是一套集群計算框架、設計目的在于以Hadoop分布式文件系統(簡稱HDFS)為基礎取代原本的Hadoop MapReduce。借助對內存內集群計算的支持能力,Spark得以在內存機制的輔助下將Hadoop MapReduce的性能表現提升達100倍,而磁盤配合時的性能提升也能達到原先的10倍。

Spark在工作流程、高級分析、流處理以及商務智能/可視化分析等數據處理領域可謂一款出色的計算引擎。不過Spark集群則是一套殊難打理的性能巨獸,Stoica強調稱。Databricks公司希望改變這一切,利用由其托管的Databricks云平臺為客戶提供易于使用的交鑰匙解決方案。

“對于企業用戶來說,將自身在大數據領域所投入的資金充分轉化為實際價值仍然是一項非常困難的任務,”Stoica表示。“這類集群很難設置與管理,而且要從數據中提取出可資利用的實際價值需要配合各種不同類型的工具方案,這無疑使整項工作難上加難。我們Databricks的愿望是能夠顯著簡化大數據處理方式,幫助用戶將精力集中在數據向實際價值的轉化身上。Databricks云能夠將Spark的強大能力與零管理托管平臺結合起來,并提供常見工作流程所必需的初始應用程序集合,這一切將有助于我們把發展愿景變成現實。”

Databricks云還能夠為交互式查詢(通過Spark SQL)、流數據(Spark Streaming)、機器學習(MLlib)以及圖形計算(GraphX)以原生方式提供支持,同時利用單一API跨越全部數據傳輸通道。Stoica表示,這套經過配置的全新Spark集群可謂一大轉折點,用戶只需為集群設定好必要的資源容量、其它工作該平臺都能獨力完成——包括在運行過程中對服務器進行配置、簡化數據導入與緩存機制、在安全性角度對Spark進行補丁安裝與更新。

該平臺還包含三款內置應用程序:

Notebooks。這是一套富界面,用于執行數據發現與瀏覽任務。Notebooks能夠以交互式方式繪制查詢結果、以腳本方式執行整套工作流并實現高級協作功能。

Dashboards。Dashboards允許用戶從之前創建的Notebooks當中選擇任意輸出結果,進而將其創建成儀表板形式并加以管理。Dashboards隨后會將結果輸出到單一頁面中的儀表板內,同時提供WYSIWYG編輯器、從而將內容向更為廣泛的受眾加以提交。

Job Launcher。Job Launcher應用程序允許任何使用者運行任意Apache Spark作業并在執行過程中予以觸發,這能大大簡化創建數據產品的實際流程。

“我們了解到,大多數企業用戶都在抱怨大數據處理并不是單一一項分析工作;真正的執行流程需要將數據存儲、ETL(即提取、轉換與加載)、數據瀏覽、儀表板與報告、高級分析以及數據產品創建等步驟結合起來,”Stoica指出。“利用當前的技術成果完成上述工作可以說相當困難。我們打造的Databricks云正是為此而生,它能夠在設備之上建立起終端到終端通道,同時支持全部強化性以及功能補充性Spark應用程序。它的設計目的在于將原本被大數據處理的超高復雜性嚇退的新用戶們重新回到這塊***價值的分析舞臺上來。”Stoica指出,上述內置應用程序還僅僅是個起點。Databricks云以100%純開源Apache Spark項目為基礎開發而成,這意味著全部現有以及未來將要出現的“經過Spark認證”的應用程序都將能夠運行在這套開箱即用的平臺之上——其中也包括十幾款Databricks于今年二月啟動其應用認證計劃以來獲得肯定的Spark應用程序。

此外,Stoica還談到,大家完全可以反其道行之。任何在Databricks云上開發而成的Spark應用程序也將能夠運行在全部“經過認證的Spark發行版”當中,也就是說用戶不會被鎖定在某種特定托管平臺身上。Databricks于上周正式啟動了其發行版認證計劃,并強調稱目前已經有五家供應商通過了認證過程,它們分別是:Datastax、Hortonworks、IBM、甲骨文以及Pivotal。

“我們衷心期待著能夠將Databricks云打造成一整套豐富多彩的生態系統,”Stoica表示。

Databricks云目前正與幾家用戶配合進行封閉beta測試,并計劃于今年八月開放限定可用beta測試,Stoica解釋稱。他同時補充道,該平臺將采用分層定價模型作為基礎計費機制,根據使用量核算使用成本。初期該平臺將只在Amazon Web Services(簡稱AWS)上與用戶見面,不過Stoica強調未來有計劃將其擴展到其它云供應商的基礎設施當中。

原文鏈接:

http://www.cio.com/article/2369158/big-data/cloud-platform-simplifies-spark-clusters-big-data-deployments.html

原文標題:Cloud Platform Simplifies Spark Clusters, Big Data Deployments

責任編輯:彭凡 來源: 51CTO
相關推薦

2017-01-11 16:57:51

大數據大數據集群監控

2012-07-27 09:37:07

大數據云計算

2014-04-16 10:41:58

Spark

2020-05-29 16:14:03

戴爾科技

2016-12-21 09:57:03

大數據

2014-05-16 10:55:47

Spark

2016-09-19 10:01:01

2014-12-05 15:37:06

2014-03-12 14:57:04

2015-02-03 03:18:56

SparkSpark內核

2014-06-25 13:57:50

云計算大數據Spark

2017-01-22 10:40:31

Hadoop云部署大數據

2009-08-03 10:02:15

BMCBSMITIL

2023-08-25 15:13:16

大數據云計算

2013-11-19 10:42:45

大數據Chef

2017-06-14 09:00:40

容器開發人員云應用

2022-07-20 15:10:38

Docker大數據平臺

2017-01-06 16:06:53

存儲IBM軟件

2023-11-02 09:00:00

Kubernetes集群

2020-03-22 15:49:27

Kafka馬蜂窩大數據平臺
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 波多野结衣一二三区 | 成人国产毛片 | 国产99热 | 精品久久影院 | 91大片 | 日韩精品一区二区三区中文字幕 | 北条麻妃99精品青青久久 | 午夜视频免费在线观看 | 呦呦在线视频 | 天天射天天操天天干 | 爱爱综合网 | 伊人久久麻豆 | 欧美日韩国产中文 | 日韩二区 | 亚洲综合视频 | 久久精品小视频 | 成人欧美一区二区三区在线播放 | 亚洲人成网亚洲欧洲无码 | 国产视频第一页 | 一区二区三区国产精品 | 在线观看国产精品视频 | 激情伊人网 | 日韩欧美在线观看视频 | 日韩精品极品视频在线观看免费 | 国产激情在线 | 精品久久香蕉国产线看观看亚洲 | 欧美国产精品一区二区三区 | 精品一区国产 | 精品一区二区在线观看 | 国产精品乱码一二三区的特点 | 日韩av大片免费看 | 国产成人免费视频网站高清观看视频 | 亚州国产 | 国产情品 | 国产欧美综合在线 | 久久一区二区免费视频 | 黄久久久 | 国产精品久久久久aaaa九色 | 天天干天天爱天天操 | 欧美理论片在线 | 欧美高清视频在线观看 |