成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

讓Spark如虎添翼的Zeppelin – 基礎篇

大數據 Spark
Spark是一個非常好的計算平臺,支持多種語言,同時基于內存的計算速度也非常快。對于剛接觸的人來說,上手以及環境搭建還是有一些困難。

0. 簡介

Spark 是一個非常好的計算平臺,支持多種語言,同時基于內存的計算速度也非常快。整個開源社區也很活躍。

但是Spark在易用性上面還是有一些美中不足。 對于剛接觸的人來說,上手以及環境搭建還是有一些困難。 另外,如果希望將結果繪制成圖表分享給別人,還需要很長一段路程。

目前已經有一些解決方案:

  • 【TBD】Jupyter Notebook
  • 使用很廣泛,但是看起來主要還是以前ipython-notebook的增強版。
  • 目前筆者對其了解不多
  • Spark 母公司DataBricks提供的DataBricks Community Edition, 里面自帶Spark集群 + Notebook。
  • 易用性、功能性都很不錯。缺點是集群架設在AWS之上,無法跟自己本地的Spark 集群連在一起
  • Apache Zeppelin
  • 這是一個剛剛從Incubation轉正的項目
  • 但是已經在各大公司均有采用,比如美團、微軟等等
  • 本文主要就是介紹如何在本地搭建一個Zeppelin 使得Spark更易用,同時可以很方便的將自己的工作成功展示給客戶

借用別人的一個效果圖鎮樓^_^

注意:

  1. Zeppelin自帶Spark實例,您無需自己構建一個Spark 集群就可以學習Zeppelin
  2. Zeppelin 當前(2016年8月19日)最新版本0.6.1, 只兼容2.0+

       1)如果您本地有Spark 集群并且版本是1.6.1 + Scala 2.10 , 請下載Zeppelin 0.6.0的版本

       2)如果官網的速度比較慢,可以參考下面的方式到百度盤下載

鏈接: http://pan.baidu.com/s/1ctBBJo 密碼: e68g

1、 下載

如果您需要的是0.6.0的版本,可以參考上面百度盤的下載鏈接。

如果您需要的是0.6.1+的版本,可以直接到官網下載, 里面的Mirror下載速度一般還不錯

2、 安裝

版本: Zeppelin 0.6.0 + 自建Spark集群(1.6.1)

感覺Zeppelin還是不太成熟,并開箱就用,還需要不少人工調整才能正常工作

1)解壓之后,首先需要從模板創建一個新的zeppelin-env.sh, 并設置SPARK_HOME. 比如:

  1. 1export SPARK_HOME=/usr/lib/spark 

如果是基于Hadoop 或者 Mesos 搭建的Spark 集群,還需要進行另外的設置。

2)從模板創建一個新的zeppelin-site.xml,并將之前的8080端口改到比如8089,避免與Tomcat等端口沖突

  1. <property> 
  2.  
  3. <name>zeppelin.server.port</name
  4.  
  5. <value>8089</value> 
  6.  
  7. <description>Server port.</description> 
  8.  
  9. </property> 

3)替換jackson相關類庫

a)默認自帶的是2.5.*, 但是實際使用的時候指定的是2.4.4

b)并且可能2.4.4 與 2.5.* 并不完全兼容。

c)因此需要使用2.4.4 替換2.5.* , 有下面3個jar需要替換:

  1. jackson-annotations-2.4.4.jar 
  2. jackson-core-2.4.4.jar 
  3. jackson-databind-2.4.4.jar 

d)這真的是非常坑人的一個地方。。。

做完上訴幾步之后,就可以啟動啦:

啟動/停止命令:

  1. bin/zeppelin-daemon.sh stop/start 

啟動之后,打開http://localhost:8089 就可以看到Zeppelin的主界面啦

3. 配置Spark解釋器

Spark Interpreter的配置非常簡單,可以直接參考下圖的配置方式:

4. 幾點使用經驗

Zeppline自帶比較詳細的Tutorial, 各位看自帶的notebook tutorial 可能效果更好。 但是我在第一次使用的時候,遇到了不少坑,在此記錄下來,給大家做個參考:

(1) 任務提交之后不會自動停止

當Zeppelin 提交任務之后,可以看到Spark Master UI 上面,當前任務即使執行完成了,也不會自動退掉

這是因為,Zeppelin 默認就像人手工運行了spark-shell spark://master-ip:7077 一樣, 除非手動關閉shell命令,否則會一直占用著資源

解決辦法就是將spark 解釋器(interpreter) 重啟

手動的重啟辦法:

1.打開Interpreter界面,搜索到Spark部分并點擊重啟

2.推薦: 調用Restful API 進行重啟。

a.可以通過Chrome的Network 監控看一下點擊restart之后具體調用的API的情況。如下圖:

 

b.這個ID(2BUDQXH2R)在各自的環境可能各不相同。另外這個API是PUT的方式,可以直接使用下面的python代碼在UI上自動重啟

  1. %python 
  2.  
  3. import requests 
  4.  
  5. r = requests.put("http://IP:8089/api/interpreter/setting/restart/2BUDQXH2R"
  6.  
  7. print r.text 

(2) 異常提示:Cannot call methods on a stopped SparkContext

比如我們在Spark Master UI 上面將當前job kill 之后,在Zeppelin這邊重啟執行任務就會遇到這個異常信息。

解決辦法很簡單: 重啟解析器

(3) 不要主動調用 sc.stop()

這是官方明確說明的:scala 的spark-shell 自動初始化了SparkContext / SqlContext 等等

不能自己調用sc.stop() 之后重啟創建一個SparkContext

可能筆者水平原因,嘗試自己創建新的sc 之后,各種奇奇怪怪的問題

(4) 關于python module

Python Interpreter可以使用當前Zeppelin所在機器的python 所有的model

同時支持python 2 與 python 3

這是一個很有用的功能,比如我使用spark將數據計算完成之后,生成了一個并不太大的csv文件。這個時候完全可以使用Pandas強大的處理能力來進行二次處理,并最終使用Zeppelin的自動繪圖能力生成報表

與Tableau之類的BI工具相比功能差了一些,不過各有所長。Zeppelin 對程序員來說可以算是非常方便的一個工具了。 對日常的一些簡單報表的工作量大大減小了

(5) 可以設置自動運行時間

在整個Note的最上端,可以設置當前notebook 定期執行。 而且注意: 還可以設置執行完成之后自動重啟interpreter 參考下圖:

責任編輯:武曉燕 來源: FlyML
相關推薦

2019-04-22 08:31:00

Docker容器工具

2022-04-29 13:39:57

AR/VR數字孿生CAD

2023-05-24 10:24:56

代碼Python

2019-07-05 08:00:00

WindowsWindows 10程序

2023-04-27 13:16:45

2019-08-21 09:51:25

軟件Windows 10Chrome

2018-04-10 11:40:23

區塊鏈云計算霧計算

2023-03-17 08:00:00

人工智能工具數據科學家

2013-10-31 11:29:38

2018-05-17 11:23:06

智能化

2017-06-09 12:05:24

散熱器CPU硬件

2025-04-10 09:10:00

.NET開源Windows

2018-04-17 09:03:01

SparkRDD大數據

2019-10-16 08:25:33

JavaScriptwebprototype

2022-08-09 08:00:55

AWS安全API

2020-04-24 08:23:23

開發在線工具前端

2021-08-30 10:19:05

PyFlink 開發環境Zeppelin No

2023-06-06 19:24:06

KubernetesSpark

2014-07-28 14:43:14

git開源
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲欧洲精品在线 | 男人的天堂一级片 | 成人免费三级电影 | 免费观看黄a一级视频 | 精品国产乱码久久久久久1区2区 | 天天搞天天操 | 久久国产欧美日韩精品 | 中文字幕亚洲一区 | 一区二区精品 | 国产精品视频一二三区 | 请别相信他免费喜剧电影在线观看 | 欧美精品三区 | 一级毛片视频在线 | 自拍在线 | 久久a久久 | 精品中文字幕一区 | 日本久久精品视频 | 中文字幕在线免费视频 | 精品国产精品 | 精品国产乱码久久久久久1区2区 | 欧美精品日韩精品 | 男人天堂网址 | 成人精品鲁一区一区二区 | 精品免费国产视频 | 九九久久精品 | 国产一区二区在线免费观看 | 亚洲精品久久国产高清情趣图文 | 久久久999成人 | 国产精品视频免费看 | 国产精品福利久久久 | 久久一区二区三区四区 | 国产激情精品一区二区三区 | 亚洲国产精品一区二区第一页 | 免费观看一级黄色录像 | 97国产精品 | 91精品国产91久久久久久最新 | 成人免费av | 欧美日韩不卡 | 午夜激情视频在线 | 综合久 | 久久久久久久久一区 |