成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Spark Streaming 妙用之實現(xiàn)工作流調(diào)度器

大數(shù)據(jù) Spark
開發(fā)一個完善的工作流調(diào)度器應(yīng)該并不是一件簡單的事情。但是通過Spark Streaming,我們也許能簡化這些工作。

之前有說過要設(shè)計一個工作流調(diào)度器。開發(fā)一個完善的工作流調(diào)度器應(yīng)該并不是一件簡單的事情。但是通過Spark Streaming(基于Transfomer架構(gòu)的理念),我們可能能簡化這些工作。我在這塊并沒有什么經(jīng)驗,這只是一個存在于腦海中的東西。

下面是Azkaban的架構(gòu)圖:

 

也就是說要搭建一個穩(wěn)定可靠的Azkaban的工作流調(diào)度器,你可能需要

  • 兩臺 互為主備MySQL
  • 兩臺Executor Server
  • 一臺Web Server

你需要做架構(gòu)設(shè)計,考慮WebServer 和 Executor Server的通訊問題

擴展性問題。Executor 能夠動態(tài)調(diào)整?

穩(wěn)定性問題。畢竟24小時運行的

然而,我們其實是不需要關(guān)注這么多東西的。我們真正關(guān)注的是:

  • Web UI
  • 工作流的生成,解析,運行和存儲

其他的都是基礎(chǔ)設(shè)施。按照Transfomer架構(gòu)的設(shè)計理念,我們應(yīng)該可以找到一個Estimator ,作為我們的基礎(chǔ)設(shè)施,我們只要關(guān)注上面兩點即可,不需要為部署,高可用,穩(wěn)定等發(fā)愁。同時我們也希望譬如WebUI等工作不是從頭開始,而是按部就班添加新功即可。所以有了Estimator,我們只要做三點:

  • 實現(xiàn)業(yè)務(wù)邏輯,也就是工作流的生成,解析,運行和存儲等操作。
  • 實現(xiàn)管理頁面邏輯
  • 指定需要的資源cpu/內(nèi)存,就能Run起來這個Transformer

我搜羅了一圈,發(fā)現(xiàn)Spark Streaming 是能夠滿足該需求的一個Estimator。

這得益于,Spark Streaming 從某個角度而言就是個定時任務(wù)調(diào)度系統(tǒng),也就是我們說的微批處理。對于工作流調(diào)度器而言,無非就是每個周期(duration)在Driver端啟動線程掃描MySQL,實現(xiàn)任務(wù)的分發(fā)和執(zhí)行。

那如果實現(xiàn)一個類似Azkaban 能夠的做的事情,前面我們提到,要做三件事情,分別對應(yīng)為:

1.實現(xiàn)業(yè)務(wù)邏輯,也就是工作流的生成,解析,運行和存儲等操作。其中生成,解析,存儲 三個環(huán)節(jié)可以放在Driver端,也可以都放在Executor 端。也就是說:Driver的設(shè)計可重可輕。重的設(shè)計可由Driver讀取MySQL 并且解析成工作流任務(wù),然后發(fā)送給Executor 去執(zhí)行。輕的設(shè)計Driver僅僅是讀取MySQL,然后就簡單將id分發(fā)給各個Executor,各個Executor 負(fù)責(zé)解析執(zhí)行和反饋結(jié)果。

2.增強 Spark Streaming UI,添加管理頁面,實現(xiàn)Azkaban Web Server類似界面。

3.按標(biāo)準(zhǔn)的Spark Streaming 程序提交該實現(xiàn)到集群即可完成部署。

我們看到,我們真正做到了只關(guān)注核心業(yè)務(wù)邏輯的實現(xiàn),所謂部署,安裝,運行等環(huán)節(jié)都實現(xiàn)了平臺化(其實Estimator完成了)。 而且實現(xiàn)了資源的細(xì)粒度(CPU/內(nèi)存)劃分,而不再是以服務(wù)器為基本單元。

事實上,我們也可以將一個Spark Streaming當(dāng)做一個crontab 任務(wù),這樣就自然具有了一個分布式的crontab系統(tǒng),并且提供更友好的管理,甚至能將任務(wù)本身融入到crontab中。

后話

Spark Streaming 不一定是最合適的Estimator,你可以自己實現(xiàn)一套類似的Estimator,最終形成所謂的 Azkaban On Yarn的程序。

責(zé)任編輯:Ophira 來源: 簡書
相關(guān)推薦

2009-03-03 09:13:36

工作流BPM業(yè)務(wù)流程

2025-05-14 03:20:00

AgenticAIMCP

2022-10-26 08:00:43

Activiti工作流BPM

2021-10-14 11:34:05

技術(shù)工作流引擎

2013-04-23 10:28:08

IBeamMDAAWF

2024-04-25 08:00:00

DevOps架構(gòu)軟件開發(fā)

2022-07-07 08:38:15

Springflowable引擎

2012-07-23 10:36:46

工作流

2023-01-04 08:02:16

工作流架構(gòu)設(shè)計

2010-01-04 17:42:50

SilverLight

2011-12-14 09:58:58

JavajBPM

2023-07-05 09:48:44

Activiti部署

2023-06-12 08:01:57

Camunda工作流引擎

2017-08-14 10:30:13

SparkSpark Strea擴容

2017-06-06 08:31:10

Spark Strea計算模型監(jiān)控

2015-07-14 09:26:28

微型工作流引擎設(shè)計

2024-08-05 12:46:51

2015-06-24 10:18:26

2025-01-26 15:13:00

2013-09-29 17:13:59

PowerShell工作流
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产成人精品久久 | 日本午夜视频 | 欧美日韩国产一区二区 | 国产91在线播放精品91 | 国产黄色av网站 | 夜久久| 中文字幕av在线播放 | 天堂久久久久久久 | 亚洲欧洲视频 | 亚洲国产精品一区二区第一页 | 涩涩视频在线播放 | 99热精品国产 | 色偷偷人人澡人人爽人人模 | 一区二区三区四区免费在线观看 | 大学生a级毛片免费视频 | 亚洲欧美高清 | www.久久久.com| 草草草网站 | 一区二区成人 | 激情国产在线 | 求毛片 | 亚洲精品九九 | 狠狠干2020 | 综合精品久久久 | 男女羞羞免费视频 | 色www精品视频在线观看 | 中文字幕乱码视频32 | 久久国产婷婷国产香蕉 | 久久久一区二区三区四区 | 盗摄精品av一区二区三区 | 亚洲a级| 精品免费观看 | 操视频网站| 韩国毛片一区二区三区 | 欧美日韩视频 | 极品在线 | 欧美一区二区三区,视频 | 精品人伦一区二区三区蜜桃网站 | 亚洲精品乱码久久久久久蜜桃 | 国产一区二区三区四区 | 在线一区观看 |