8000字 + 25圖探秘Xxl-Job核心架構(gòu)原理
核心概念
這里還是老樣子,為了保證文章的完整性和連貫性,方便那些沒有使用過的小伙伴更加容易接受文章的內(nèi)容,快速講一講Xxl-Job中的概念和使用
如果你已經(jīng)使用過了,可直接跳過本節(jié)和下一節(jié),快進到后面原理部分講解
1、調(diào)度中心
調(diào)度中心是一個單獨的Web服務,主要是用來觸發(fā)定時任務的執(zhí)行
它提供了一些頁面操作,我們可以很方便地去管理這些定時任務的觸發(fā)邏輯
調(diào)度中心依賴數(shù)據(jù)庫,所以數(shù)據(jù)都是存在數(shù)據(jù)庫中的
調(diào)度中心也支持集群模式,但是它們所依賴的數(shù)據(jù)庫必須是同一個
所以同一個集群中的調(diào)度中心實例之間是沒有任何通信的,數(shù)據(jù)都是通過數(shù)據(jù)庫共享的
圖片
2、執(zhí)行器
執(zhí)行器是用來執(zhí)行具體的任務邏輯的
執(zhí)行器你可以理解為就是平時開發(fā)的服務,一個服務實例對應一個執(zhí)行器實例
每個執(zhí)行器有自己的名字,為了方便,你可以將執(zhí)行器的名字設置成服務名
3、任務
任務什么意思就不用多說了
一個執(zhí)行器中也是可以有多個任務的
總的來說,調(diào)用中心是用來控制定時任務的觸發(fā)邏輯,而執(zhí)行器是具體執(zhí)行任務的,這是一種任務和觸發(fā)邏輯分離的設計思想,這種方式的好處就是使任務更加靈活,可以隨時被調(diào)用,還可以被不同的調(diào)度規(guī)則觸發(fā)。
圖片
來個Demo
1、搭建調(diào)度中心
調(diào)度中心搭建很簡單,先下載源碼
然后改一下數(shù)據(jù)庫連接信息,執(zhí)行一下在項目源碼中的/doc/db下的sql文件
圖片
啟動可以打成一個jar包,或者本地啟動就是可以的
啟動完成之后,訪問下面這個地址就可以訪問到控制臺頁面了
http://localhost:8080/xxl-job-admin/toLogin
用戶名密碼默認是 admin/123456
2、執(zhí)行器和任務添加
添加一個名為sanyou-xxljob-demo執(zhí)行器
圖片
任務添加
圖片
執(zhí)行器選擇我們剛剛添加的,指定任務名稱為TestJob,corn表達式的意思是每秒執(zhí)行一次
創(chuàng)建完之后需要啟動一下任務,默認是關閉狀態(tài),也就不會執(zhí)行
圖片
創(chuàng)建執(zhí)行器和任務其實就是CRUD,并沒有復雜的業(yè)務邏輯
按照如上配置的整個Demo的意思就是
每隔1s,執(zhí)行一次sanyou-xxljob-demo這個執(zhí)行器中的TestJob任務
3、創(chuàng)建執(zhí)行器和任務
引入依賴
<dependencies>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-web</artifactId>
<version>2.2.5.RELEASE</version>
</dependency>
<dependency>
<groupId>com.xuxueli</groupId>
<artifactId>xxl-job-core</artifactId>
<version>2.4.0</version>
</dependency>
</dependencies>
配置XxlJobSpringExecutor這個Bean
@Configuration
public class XxlJobConfiguration {
@Bean
public XxlJobSpringExecutor xxlJobExecutor() {
XxlJobSpringExecutor xxlJobSpringExecutor = new XxlJobSpringExecutor();
//設置調(diào)用中心的連接地址
xxlJobSpringExecutor.setAdminAddresses("http://localhost:8080/xxl-job-admin");
//設置執(zhí)行器的名稱
xxlJobSpringExecutor.setAppname("sanyou-xxljob-demo");
//設置一個端口,后面會講作用
xxlJobSpringExecutor.setPort(9999);
//這個token是保證訪問安全的,默認是這個,當然可以自定義,
// 但需要保證調(diào)度中心配置的xxl.job.accessToken屬性跟這個token是一樣的
xxlJobSpringExecutor.setAccessToken("default_token");
//任務執(zhí)行日志存放的目錄
xxlJobSpringExecutor.setLogPath("./");
return xxlJobSpringExecutor;
}
}
XxlJobSpringExecutor這個類的作用,后面會著重講
通過@XxlJob指定一個名為TestJob的任務,這個任務名需要跟前面頁面配置的對應上
@Component
public class TestJob {
private static final Logger logger = LoggerFactory.getLogger(TestJob.class);
@XxlJob("TestJob")
public void testJob() {
logger.info("TestJob任務執(zhí)行了。。。");
}
}
所以如果順利的話,每隔1s鐘就會打印一句TestJob任務執(zhí)行了。。。
啟動項目,注意修改一下端口,因為調(diào)用中心默認也是8080,本地起會端口沖突
最終執(zhí)行結(jié)果如下,符合預期
圖片
講完概念和使用部分,接下來就來好好講一講Xxl-Job核心的實現(xiàn)原理
從執(zhí)行器啟動說起
前面Demo中使用到了一個很重要的一個類
XxlJobSpringExecutor
這個類就是整個執(zhí)行器啟動的入口
圖片
這個類實現(xiàn)了SmartInitializingSingleton接口
所以經(jīng)過Bean的生命周期,一定會調(diào)用afterSingletonsInstantiated這個方法的實現(xiàn)
這個方法干了很多初始化的事,這里我挑三個重要的講,其余的等到具體的功能的時候再提
1、初始化JobHandler
JobHandler是個什么?
所謂的JobHandler其實就是一個定時任務的封裝
圖片
一個定時任務會對應一個JobHandler對象
當執(zhí)行器執(zhí)行任務的時候,就會調(diào)用JobHandler的execute方法
JobHandler有三種實現(xiàn):
- MethodJobHandler
- GlueJobHandler
- ScriptJobHandler
MethodJobHandler是通過反射來調(diào)用方法執(zhí)行任務
圖片
所以MethodJobHandler的任務的實現(xiàn)就是一個方法,剛好我們demo中的例子任務其實就是一個方法
所以Demo中的任務最終被封裝成一個MethodJobHandler
GlueJobHandler比較有意思,它支持動態(tài)修改任務執(zhí)行的代碼
當你在創(chuàng)建任務的時候,需要指定運行模式為GLUE(Java)
圖片
之后需要在操作按鈕點擊GLUE IDE編寫Java代碼
圖片
代碼必須得實現(xiàn)IJobHandler接口,之后任務執(zhí)行的時候就會執(zhí)行execute方法的實現(xiàn)
如果你需要修改任務的邏輯,只需要重新編輯即可,不需要重啟服務
ScriptJobHandler,通過名字也可以看出,是專門處理一些腳本的
運行模式除了BEAN和GLUE(Java)之外,其余都是腳本模式
而本節(jié)的主旨,所謂的初始化JobHandler就是指,執(zhí)行器啟動的時候會去Spring容器中找到加了@XxlJob注解的Bean
解析注解,然后封裝成一個MethodJobHandler對象,最終存到XxlJobSpringExecutor成員變量的一個本地的Map緩存中
圖片
緩存key就是任務的名字
圖片
至于GlueJobHandler和ScriptJobHandler都是任務觸發(fā)時才會創(chuàng)建
除了上面這幾種,你也自己實現(xiàn)JobHandler,手動注冊到JobHandler的緩存中,也是可以通過調(diào)度中心觸發(fā)的
2、創(chuàng)建一個Http服務器
除了初始化JobHandler之外,執(zhí)行器還會創(chuàng)建一個Http服務器
這個服務器端口號就是通過XxlJobSpringExecutor配置的端口,demo中就是設置的是9999,底層是基于Netty實現(xiàn)的
圖片
這個Http服務端會接收來自調(diào)度中心的請求
當執(zhí)行器接收到調(diào)度中心的請求時,會把請求交給ExecutorBizImpl來處理
圖片
這個類非常重要,所有調(diào)度中心的請求都是這里處理的
ExecutorBizImpl實現(xiàn)了ExecutorBiz接口
當你翻源碼的時候會發(fā)現(xiàn),ExecutorBiz還有一個ExecutorBizClient實現(xiàn)
圖片
ExecutorBizClient的實現(xiàn)就是發(fā)送http請求,所以這個實現(xiàn)類是在調(diào)度中心使用的,用來訪問執(zhí)行器提供的http接口
圖片
3、注冊到調(diào)度中心
當執(zhí)行器啟動的時候,會啟動一個注冊線程,這個線程會往調(diào)度中心注冊當前執(zhí)行器的信息,包括兩部分數(shù)據(jù)
- 執(zhí)行器的名字,也就是設置的appname
- 執(zhí)行器所在機器的ip和端口,這樣調(diào)度中心就可以訪問到這個執(zhí)行器提供的Http接口
前面提到每個服務實例都會對應一個執(zhí)行器實例,所以調(diào)用中心會保存每個執(zhí)行器實例的地址
圖片
這里你可以把調(diào)度中心的功能類比成注冊中心
任務觸發(fā)原理
弄明白執(zhí)行器啟動時干了哪些事,接下來講一講Xxl-Job最最核心的功能,那就是任務觸發(fā)的原理
任務觸發(fā)原理我會分下面5個小點來講解
- 任務如何觸發(fā)?
- 快慢線程池的異步觸發(fā)任務優(yōu)化
- 如何選擇執(zhí)行器實例?
- 執(zhí)行器如何去執(zhí)行任務?
- 任務執(zhí)行結(jié)果的回調(diào)
1、任務如何觸發(fā)?
調(diào)度中心在啟動的時候,會開啟一個線程,這個線程的作用就是來計算任務觸發(fā)時機,這里我把這個線程稱為調(diào)度線程
這個調(diào)度線程會去查詢xxl_job_info這張表
這張表存了任務的一些基本信息和任務下一次執(zhí)行的時間
調(diào)度線程會去查詢下一次執(zhí)行的時間 <= 當前時間 + 5s的任務
這個5s是XxlJob寫死的,被稱為預讀時間,提前讀出來,保證任務能準時觸發(fā)
舉個例子,假設當前時間是2023-11-29 08:00:10,這里的查詢就會查出下一次任務執(zhí)行時間在2023-11-29 08:00:15之前執(zhí)行的任務
圖片
查詢到任務之后,調(diào)度線程會去將這些任務根據(jù)執(zhí)行時間劃分為三個部分:
- 當前時間已經(jīng)超過任務下一次執(zhí)行時間5s以上,也就是需要在2023-11-29 08:00:05(不包括05s)之前的執(zhí)行的任務
- 當前時間已經(jīng)超過任務下一次執(zhí)行時間,但是但不足5s,也就是在2023-11-29 08:00:05和2023-11-29 08:00:10(不包括10s)之間執(zhí)行的任務
- 還未到觸發(fā)時間,但是一定是5s內(nèi)就會觸發(fā)執(zhí)行的
圖片
對于第一部分的已經(jīng)超過5s以上時間的任務,會根據(jù)任務配置的調(diào)度過期策略來選擇要不要執(zhí)行
圖片
調(diào)度過期策略就兩種,就是字面意思
- 直接忽略這個已經(jīng)過期的任務
- 立馬執(zhí)行一次這個過期的任務
對于第二部分的超時時間在5s以內(nèi)的任務,就直接立馬執(zhí)行一次,之后如果判斷任務下一次執(zhí)行時間就在5s內(nèi),會直接放到一個時間輪里面,等待下一次觸發(fā)執(zhí)行
對于第三部分任務,由于還沒到執(zhí)行時間,所以不會立馬執(zhí)行,也是直接放到時間輪里面,等待觸發(fā)執(zhí)行
當這批任務處理完成之后,不論是前面是什么情況,調(diào)度線程都會去重新計算每個任務的下一次觸發(fā)時間,然后更新xxl_job_info這張表的下一次執(zhí)行時間
到此,一次調(diào)度的計算就算完成了
之后調(diào)度線程還會繼續(xù)重復上面的步驟,查任務,調(diào)度任務,更新任務下次執(zhí)行時間,一直死循環(huán)下去,這就實現(xiàn)了任務到了執(zhí)行時間就會觸發(fā)的功能
這里在任務觸發(fā)的時候還有一個很有意思的細節(jié)
由于調(diào)度中心可以是集群的形式,每個調(diào)度中心實例都有調(diào)度線程,那么如何保證任務在同一時間只會被其中的一個調(diào)度中心觸發(fā)一次?
我猜你第一時間肯定想到分布式鎖,但是怎么加呢?
XxlJob實現(xiàn)就比較有意思了,它是基于八股文中常說的通過數(shù)據(jù)庫來實現(xiàn)的分布式鎖的
在調(diào)度之前,調(diào)度線程會嘗試執(zhí)行下面這句sql
圖片
就是這個sql
select * from xxl_job_lock where lock_name = 'schedule_lock' for update
一旦執(zhí)行成功,說明當前調(diào)度中心成功搶到了鎖,接下來就可以執(zhí)行調(diào)度任務了
當調(diào)度任務執(zhí)行完之后再去關閉連接,從而釋放鎖
由于每次執(zhí)行之前都需要去獲取鎖,這樣就保證在調(diào)度中心集群中,同時只有一個調(diào)度中心執(zhí)行調(diào)度任務
最后畫一張圖來總結(jié)一下這一小節(jié)
圖片
2、快慢線程池的異步觸發(fā)任務優(yōu)化
當任務達到了觸發(fā)條件,并不是由調(diào)度線程直接去觸發(fā)執(zhí)行器的任務執(zhí)行
調(diào)度線程會將這個觸發(fā)的任務交給線程池去執(zhí)行
所以上圖中的最后一部分觸發(fā)任務執(zhí)行其實是線程池異步去執(zhí)行的
那么,為什么要使用線程池異步呢?
主要是因為觸發(fā)任務,需要通過Http接口調(diào)用具體的執(zhí)行器實例去觸發(fā)任務
圖片
這一過程必然會耗費時間,如果調(diào)度線程去做,就會耽誤調(diào)度的效率
所以就通過異步線程去做,調(diào)度線程只負責判斷任務是否需要執(zhí)行
并且,Xxl-Job為了進一步優(yōu)化任務的觸發(fā),將這個觸發(fā)任務執(zhí)行的線程池劃分成快線程池和慢線程池兩個線程池
圖片
在調(diào)用執(zhí)行器的Http接口觸發(fā)任務執(zhí)行的時候,Xxl-Job會去記錄每個任務的觸發(fā)所耗費的時間
注意并不是任務執(zhí)行時間,只是整個Http請求耗時時間,這是因為執(zhí)行器執(zhí)行任務是異步執(zhí)行的,所以整個時間不包括任務執(zhí)行時間,這個后面會詳細說
當任務一次觸發(fā)的時間超過500ms,那么這個任務的慢次數(shù)就會加1
如果這個任務一分鐘內(nèi)觸發(fā)的慢次數(shù)超過10次,接下來就會將觸發(fā)任務交給慢線程池去執(zhí)行
所以快慢線程池就是避免那種頻繁觸發(fā)并且每次觸發(fā)時間還很長的任務阻塞其它任務的觸發(fā)的情況發(fā)生
3、如何選擇執(zhí)行器實例?
上一節(jié)說到,當任務需要觸發(fā)的時候,調(diào)度中心會向執(zhí)行器發(fā)送Http請求,執(zhí)行器去執(zhí)行具體的任務
那么問題來了
由于一個執(zhí)行器會有很多實例,那么應該向哪個實例請求?
這其實就跟任務配置時設置的路由策略有關了
圖片
從圖上可以看出xxljob支持多種路由策略
除了分片廣播,其余的具體的算法實現(xiàn)都是通過ExecutorRouter的實現(xiàn)類來實現(xiàn)的
圖片
這里簡單講一講各種算法的原理,有興趣的小伙伴可以去看看內(nèi)部的實現(xiàn)細節(jié)
第一個、最后一個、輪詢、隨機都很簡單,沒什么好說的
一致性Hash講起來比較復雜,你可以先看看這篇文章,再去查看Xxl-Job的代碼實現(xiàn)
最不經(jīng)常使用(LFU:Least Frequently Used):Xxl-Job內(nèi)部會有一個緩存,統(tǒng)計每個任務每個地址的使用次數(shù),每次都選擇使用次數(shù)最少的地址,這個緩存每隔24小時重置一次
最近最久未使用(LRU:Least Recently Used):將地址存到LinkedHashMap中,它利用LinkedHashMap可以根據(jù)元素訪問(get/put)順序來給元素排序的特性,快速找到最近最久未使用(未訪問)的節(jié)點
故障轉(zhuǎn)移:調(diào)度中心都會去請求每個執(zhí)行器,只要能接收到響應,說明執(zhí)行器正常,那么任務就會交給這個執(zhí)行器去執(zhí)行
忙碌轉(zhuǎn)移:調(diào)度中心也會去請求每個執(zhí)行器,判斷執(zhí)行器是不是正在執(zhí)行當前需要執(zhí)行的任務(任務執(zhí)行時間過長,導致上一次任務還沒執(zhí)行完,下一次又觸發(fā)了),如果在執(zhí)行,說明忙碌,不能用,否則就可以用
分片廣播:XxlJob給每個執(zhí)行器分配一個編號,從0開始遞增,然后向所有執(zhí)行器觸發(fā)任務,告訴每個執(zhí)行器自己的編號和總共執(zhí)行器的數(shù)據(jù)
我們可以通過XxlJobHelper#getShardIndex獲取到編號,XxlJobHelper#getShardTotal獲取到執(zhí)行器的總數(shù)據(jù)量
分片廣播就是將任務量分散到各個執(zhí)行器,每個執(zhí)行器只執(zhí)行一部分任務,加快任務的處理
舉個例子,比如你現(xiàn)在需要處理30w條數(shù)據(jù),有3個執(zhí)行器,此時使用分片廣播,那么此時可將任務分成3分,每份10w條數(shù)據(jù),執(zhí)行器根據(jù)自己的編號選擇對應的那份10w數(shù)據(jù)處理
圖片
當選擇好了具體的執(zhí)行器實例之后,調(diào)用中心就會攜帶一些觸發(fā)的參數(shù),發(fā)送Http請求,觸發(fā)任務
4、執(zhí)行器如何去執(zhí)行任務?
相信你一定記得我前面在說執(zhí)行器啟動是會創(chuàng)建一個Http服務器的時候提到這么一句
當執(zhí)行器接收到調(diào)度中心的請求時,會把請求交給ExecutorBizImpl來處理
所以前面提到的故障轉(zhuǎn)移和忙碌轉(zhuǎn)移請求執(zhí)行器進行判斷,最終執(zhí)行器也是交給ExecutorBizImpl處理的
執(zhí)行器處理觸發(fā)請求是這個ExecutorBizImpl的run方法實現(xiàn)的
圖片
當執(zhí)行器接收到請求,在正常情況下,執(zhí)行器會去為這個任務創(chuàng)建一個單獨的線程,這個線程被稱為JobThread
每個任務在觸發(fā)的時候都有單獨的線程去執(zhí)行,保證不同的任務執(zhí)行互不影響
之后任務并不是直接交給線程處理的,而是直接放到一個內(nèi)存隊列中,線程直接從隊列中獲取任務
圖片
這里我相信你一定有個疑惑
為什么不直接處理,而是交給隊列,從隊列中獲取任務呢?
那就得講講不正常的情況了
如果調(diào)度中心選擇的執(zhí)行器實例正在處理定時任務,那么此時該怎么處理呢?**
這時就跟阻塞處理策略有關了
圖片
阻塞處理策略總共有三種:
- 單機串行
- 丟棄后續(xù)調(diào)度
- 覆蓋之前調(diào)度
單機串行的實現(xiàn)就是將任務放到隊列中,由于隊列是先進先出的,所以就實現(xiàn)串行,這也是為什么放在隊列的原因
丟棄調(diào)度的實現(xiàn)就是執(zhí)行器什么事都不用干就可以了,自然而然任務就丟了
覆蓋之前調(diào)度的實現(xiàn)就很暴力了,他是直接重新創(chuàng)建一個JobThread來執(zhí)行任務,并且嘗試打斷之前的正在處理任務的JobThread,丟棄之前隊列中的任務
打斷是通過Thread#interrupt方法實現(xiàn)的,所以正在處理的任務還是有可能繼續(xù)運行,并不是說一打斷正在運行的任務就終止了
這里需要注意的一點就是,阻塞處理策略是對于單個執(zhí)行器上的任務來生效的,不同執(zhí)行器實例上的同一個任務是互不影響的
比如說,有一個任務有兩個執(zhí)行器A和B,路由策略是輪詢
任務第一次觸發(fā)的時候選擇了執(zhí)行器實例A,由于任務執(zhí)行時間長,任務第二次觸發(fā)的時候,執(zhí)行器的路由到了B,此時A的任務還在執(zhí)行,但是B感知不到A的任務在執(zhí)行,所以此時B就直接執(zhí)行了任務
所以此時你配置的什么阻塞處理策略就沒什么用了
如果業(yè)務中需要保證定時任務同一時間只有一個能運行,需要把任務路由到同一個執(zhí)行器上,比如路由策略就選擇第一個
5、任務執(zhí)行結(jié)果的回調(diào)
當任務處理完成之后,執(zhí)行器會將任務執(zhí)行的結(jié)果發(fā)送給調(diào)度中心
圖片
如上圖所示,這整個過程也是異步化的
- JobThread會將任務執(zhí)行的結(jié)果發(fā)送到一個內(nèi)存隊列中
- 執(zhí)行器啟動的時候會開啟一個處發(fā)送任務執(zhí)行結(jié)果的線程:TriggerCallbackThread
- 這個線程會不停地從隊列中獲取所有的執(zhí)行結(jié)果,將執(zhí)行結(jié)果批量發(fā)送給調(diào)度中心
- 調(diào)用中心接收到請求時,會根據(jù)執(zhí)行的結(jié)果修改這次任務的執(zhí)行狀態(tài)和進行一些后續(xù)的事,比如失敗了是否需要重試,是否有子任務需要觸發(fā)等等
到此,一次任務的就算真正處理完成了
最后
最后我從官網(wǎng)撈了一張Xxl-Job架構(gòu)圖
圖片
奈何作者不更新吶,導致這個圖稍微有點老了,有點跟現(xiàn)有的架構(gòu)對不上
比如說圖中的自研RPC(xxl-rpc)部分已經(jīng)替換成了Http協(xié)議,這主要是擁抱生態(tài),方便跨語言接入
但是不要緊,大體還是符合現(xiàn)在的整個的架構(gòu)
從架構(gòu)圖中也可以看出來,本文除了日志部分的內(nèi)容沒有提到,其它的整個核心邏輯基本上都講到了
而日志部分其實是個輔助的作用,讓你更方便查看任務的運行情況,對任務的觸發(fā)邏輯是沒有影響的,所以就沒講了
所以從本文的講解再到官方架構(gòu)圖,你會發(fā)現(xiàn)整個Xxl-Job不論是使用還是實現(xiàn)都是比較簡單的,非常的輕量級