Oracle連接滿了,無法登錄數據庫,如何分析連接來源?
作者:chenjuchao
通過服務器IP,進程名,文件名等可以精確定位到具體的應用,可以溝通臨時停止或重啟此應用,最后排查此應用連接不釋放的問題。
問題現象:
收到數據庫連接數使用率高的告警:
[ID:xxx][CJC測試系統:XXX][數據庫],連接數使用率偏高,the current value is 95.58 %[CJC],故障發生時間:2025-02-28 xx:xx:xx
嘗試登錄數據庫:
cjc-db-01# sqlplus / as sysdba
SQL> select * from v$resource_limit;
select * from v$resource_limit
*
ERROR at line 1:
ORA-01012: not logged on
Process ID: 0
Session ID: 0 Serial number: 0
SQL> select status from v$instance;
select status from v$instance
*
ERROR at line 1:
ORA-01012: not logged on
Process ID: 0
Session ID: 0 Serial number: 0
告警日志如下:
Process W004 submission failed with error = 20
ORA-00020: maximum number of processes (430) exceeded
ORA-20 errors will not be written to the alert log for
the next minute. Please look at trace files to see all
the ORA-20 errors.
問題分析:
臨時解決方案 重啟應用 或 重啟數據庫釋放連接,但是如果不定位到連接來源,重啟后問題仍有可能發生。
數據庫服務器,查看連接來源,可以通過netstat或監聽日志查看,本次通過netstat進行查看:
netstat -ano | grep 1521 > 0228.log
more 0228.log
cat 0228.log|wc -l
445
cat 0228.log | grep 192.168.0.101|wc -l
394
可以看到,數據庫連接來源主要是 192.168.0.101 。
繼續查看 192.168.0.101 服務器上什么應用連接的數據庫:
登錄到這臺服務器:
通過 netstat 命令檢查,查看到是 pid=6666 的java程序在連接數據庫。
root@cjc-xx-02:#netstat -lanp|grep 1521|more
tcp 0 0 192.168.0.101:**** 192.168.0.103:1521 ESTABLISHED 6666/java
tcp 0 0 192.168.0.101:**** 192.168.0.103:1521 ESTABLISHED 6666/java
tcp 0 0 192.168.0.101:**** 192.168.0.103:1521 ESTABLISHED 6666/java
tcp 0 0 192.168.0.101:**** 192.168.0.103:1521 ESTABLISHED 6666/java
......
當前還有283個連接
root@cjc-xx-02:#netstat -lanp|grep 1521|wc -l
283
查看對應的進程
root@cjc-xx-02:#ps -ef|grep 6666
tomcat 6666 1 0 Feb24 ? 00:16:38 java -jar -Xms****M -Xmx****M xxxtestxxx.jar --spring.profiles.active=xxx
查找對應的文件
root@cjc-xx-02:#find / -name xxxtestxxx.jar
解決方案:
通過服務器IP,進程名,文件名等可以精確定位到具體的應用,可以溝通臨時停止或重啟此應用,最后排查此應用連接不釋放的問題。
責任編輯:武曉燕
來源:
IT小Chen