連接池中非常關(guān)鍵的兩個參數(shù),到底是干啥用的?
背景
說來慚愧,從事互聯(lián)網(wǎng)開發(fā)好些年了,有些概念一直沒有徹底搞清楚。其中之一就是,ttp client配置連接池的時候,maxConnectionsPerHost,和maxTotalConnections,在網(wǎng)上搜了一圈,發(fā)現(xiàn)很多都講的含含糊糊的。而且有不少故障都是這兩個參數(shù)設(shè)置不合理,或者壓根就沒有設(shè)置maxConnectionsPerHost等等。
題外話,我記得我剛參加工作的時候,第一次使用http client。看見項目中,配置的連接池,有maxConnectionsPerHost,我就請教同事,這個參數(shù)是干啥的。他的答復(fù)是每條路由最大的連接數(shù)。我似懂非懂,但是又不敢多問,哈哈。
分析過程
maxTotalConnections,很好理解。既然是一個連接池,那么一個池子最大能放多少呢?這個參數(shù)默認(rèn)是20。當(dāng)然這個參數(shù),在不同的連接池實現(xiàn)中可能是不一樣,這不是我關(guān)注的重點。

maxConnectionsPerHost,表示一個連接池中,每條路由,池化的最大連接個數(shù)。這個值,默認(rèn)是2,我看過不少故障是沒有設(shè)置此值導(dǎo)致的。這個不是我關(guān)注的重點,我的疑問是,什么是路由?什么是連接?路由和連接的關(guān)系是啥?
首先連接是什么?這個概念很清晰,連接就是源ip:源端口加目的ip:目的端口,以及相關(guān)信息形成的邏輯概念。
那什么是路由呢?我的腦袋,一團(tuán)混亂。網(wǎng)上也沒有比較好的文章,能解答我的疑問。我的猜測是,目的host+port端口就是路由。比如你的項目中需要訪問百度。那么baidu.com+80就是一條路由。同時也需要訪問csdn,那么csdn.net+80也是一條路由。可是這只是我的猜測。
那看看源碼吧。不同版本的http client實現(xiàn)方式是不一樣的。我手頭的項目有3.x,也有4.x的。我都簡單看了下,但是源碼都有一個問題是,route的實現(xiàn)類中,既有host,也有l(wèi)ocalAddress。

為了繼續(xù)解答我的疑問,還是直接debug。簡單寫了一個單元測試,類似這樣。

然后我看到了這樣的信息,以3.x源碼為例子,4.x原理是一致的。

獲取連接的過程,HostConfiguration 雖然其中有本地的地址信息的,但是值是空的。因此route真正起作用的是host。

獲取好連接后,檢查下連接是不是打開了,如果沒有打開,執(zhí)行open方法,此時會設(shè)置localAddress。也就是一條真正的連接才算創(chuàng)建完成。
接下來我們看下Http的連接池,有數(shù)據(jù)的情況是啥樣。

至此我們就清晰了,連接池是以host(遠(yuǎn)端的服務(wù),例如baidu.com)為組,來建立連接池。maxConnectionsPerHost 用來控制一組中連接池的個數(shù),也就是有些同學(xué)提到的,用來控制訪問某個服務(wù)并發(fā)的個數(shù)。
結(jié)論
maxConnectionsPerHost,連接池是以host(遠(yuǎn)端的服務(wù),例如baidu.com)為組,來建立連接池。此參數(shù)用來控制一組中連接池的個數(shù),或者用來控制訪問,某個服務(wù)并發(fā)的個數(shù)。
需要注意默認(rèn)值是2,如果不設(shè)置此值。但是流量變大,那么線上故障就會等著你。