實戰案例:某樓宇網絡改造后,高峰期很多終端DHCP拿不到IP?原因竟是它!太常見了
本期分享的案例是有線網絡的相關問題。
問題背景
客戶是一家專做弱電項目的集成商,近期承接了某園區網的改造項目,主要目的在于提升網絡可靠性,保證業務不間斷,路由交換設備為某W。改進具體措施是:
- 原來單臺出口路由改成雙機熱備并部署BFD;
- 核心采用堆疊交換機替代原有的匯聚交換機,作為VLAN網關和DHCP服務器;
- 核心和匯聚交換機之間做端口聚合eth-trunk接口。
基本拓撲如下:
問題描述
但某樓宇改造變更后,上班高峰期總有用戶不到自動獲取IP地址或者很艱難才拿到IP,在某獲取失敗的電腦上抓包和查看網卡信息如下:
下面我們一起看下該問題如何排查~
排查分析
第一步:確認核心交換機DHCP收發包是否正常
首先查看核心交換機對應的接口是否正常收到了客戶端的DHCP請求并做offer響應,通過報文分析來看:每個上來交給核心交換機的DHCP請求(DHCP discovery)核心都會回,但是診斷發現獲取不到IP的電腦的請求并沒有交給核心交換機,也就是說,可能在下聯設備上丟包了。
第二步:確認總吞吐量無法跑滿2Gbps問題
檢查匯聚交換機的端口,發現有大量丟棄報文,報文頭分析發現丟棄的都是discovery、offer這種廣播報文。
第三步:配置檢查
檢查該端口配置,發現有廣播抑制的配置:
broadcast-suppression packets 100
表示每秒可轉發的廣播包最大100個,刪除此配置或者將值改大,問題解決。
解決方案
(1) 根本原因
由于DHCP協議工作流程,如下圖所示:
第一階段DHCP DISCOVER報文是客戶機通過廣播來發現可用的DHCP服務器,因此客戶機較多情況下,端口配置的廣播抑制可能會影響用戶自動獲取IP地址。
(2) 建議與總結
- 獲取DHCP地址困難的故障可能與端口配置的廣播抑制相關。
- 部署業務時,應合理設置端口廣播抑制值,具體取值應根據業務實際情況觀察并調整,以不影響業務的下限為好。