案例:用戶想用5G網橋無線回傳工業相機的300M流量,但本地測試僅有150M!注意這個配置...
本期分享的案例是無線網絡的相關問題。
背景介紹
用戶是一家做工業設備的廠商,近期項目上計劃上一批“工業相機”,方案是通過無線網橋接入甲方核心網實現回傳,拓撲很簡單如下:
服務器—核心網—主網橋 ))(( 子網橋—工業相機
然而用戶采購了一批WIFI5的無線網橋本地搭類似拓撲測試,發現近距離橋接、協商速率達866Mbps的情況下,實際吞吐量也只有150Mbps,遠不能滿足工業相機的使用:
接下來一起看看如何排查此問題。
處理思路
一般來講,針對這種最基本的吞吐量測試問題,要叢產品性能、軟件版本上考慮:
- 確認網橋的規格是否符合方案;
- 確定網橋產品的軟件版本是否廠商最新;
- 考慮是否存在性能瓶頸問題。
排查分析
第一步:確認網橋的規格是否符合方案
用戶采購的是雙天線WIFI 5網橋,無線協商866Mbps,理論上實際吞吐量是協商速率*60%,也就是500Mbps上下才是符合預期的
(這里有人會問:為啥協商速率866M實際上只能由500M的傳輸?怎么和有些協商千兆跑千兆不一樣呀?因為無線要考慮ACK交互損耗,并且無線環境會有大量的丟包重傳,所以收發的有效數據包和有線差別是很大的,這里不展開講原理了,結論自己記一下就行,WIFI6、WIFI7百分比更高一些)
所以設備的規格符合方案,但是實際吞吐不符合預期;然后和廠商400技術支持確認,設備版本最新。接下來就考慮產品性能問題了。
第二步:確認跑流時網橋設備的CPU性能
跑流測試的時候登錄網橋頁面查看其CPU情況,確實發現了異常,跑流時竟達到了100%:
用戶懷疑是個例樣機的問題,然后換了幾對測試也是這樣,難道去確定是產品問題?致電廠商后,那邊本地也搭了類似拓撲測試吞吐量,用iperf3能跑到450Mbps+,沒復現問題,懷疑和用戶本地測試的流有關系。接下來wireshark抓去本地的iperf3測試流看看有什么問題。
第三步:抓取數據流分析
抓包發現實驗測試PC跑Iperf3時,發的居然時9K字節以上的巨型幀,還有17000字節的,沒有分片,這才發現了問題“電腦的網卡啟用了巨型幀9K”(但這里能發出17000字節的包也不知道為什么,理論上來說MTU應該是9K字節才對):
無線設備基本不支持巨型幀,所以均會分片然后封裝無線幀頭傳輸,性能大大降低:
原因定位:
實驗室搭建無線網橋拓撲,模仿工業相機的跑流測試起不來的原因是因為PC網卡開了巨型幀。據用戶描述,工業相機默認也是支持巨型幀9K傳輸的,所以他們才這樣做的測試,但實際上有線網絡環境不影響,無線則會導致網橋性能降低。
原理及解決方案
采用無線網橋回傳方案就不要開啟巨型幀了(工業相機也不要啟用巨型幀),PC關閉巨型幀后吞吐量也能跑上去了: