惡意爬蟲正在搞垮你的網站,這屆“網絡流氓”真不好對付
在整個互聯網中,真實訪客的流量有多少?90%?70%?還是50%?
著名調查機構Aberdeen Group在2019年做過一次調查,真實訪客的流量,只占到全網流量的62.8%,其余的37.2%是機器人(Bot)刷出來的流量。
惡意Bot
在這些Bot流量中,惡意Bot占比高達24.1%,早在2015年,這一數據僅為18.6%。短短5年時間里,惡意Bot占比上升6個百分點,這個比例意味著什么?
如果企業經營一家網站,可能意味著,24%的用戶是假的;策劃一個線上活動,其中24%的獎品,會被Bot刷走;24%的服務器資源會被浪費……
對于一個正在成長的企業而言,是相當致命的。惡意Bot能在各個方面對企業正常業務產生廣泛影響。
(1) 惡意注冊
2020年底,微信發布公告,封禁涉嫌惡意注冊的300萬個賬號,因惡意注冊被封禁的賬號,已經超過620萬個。
如此龐大的注冊數量,將導致企業無法獲得真實的用戶數據,從而在做出決策時,產生偏差。短時間內大量注冊,也會給服務器帶來壓力。惡意注冊的賬號如果在市場上流通,還會給企業帶來政策法規方面的風險。
(2) 非法登錄
2018年,一名英國男子對17個網站發起暴力破解,竊取超過16.5萬條用戶信息,并將它們打包在暗網進行售賣。
通過Bot進行撞庫和暴力破解,攻擊者可以非法獲取賬號敏感信息,例如姓名、手機號等等,可以將這些信息打包販賣。而且還可以盜取賬號資產,或者權限,用于非法目的。
(3) 非法抓取
2019年,今日頭條因為大量抓取百度搜索結果,被百度以不正當競爭為由起訴,索賠9000萬元。
非法抓取大案不止,小案不斷,因為爬蟲抓取他人信息的案件時有發生。站在企業角度上看,被惡意爬蟲光顧,業務核心數據被抓取,對手輕易獲取這些信息,會導致網站競爭力下降。
(4) 惡意刷票
大量惡意刷票搶票Bot,會讓正常用戶無法購買所需的票。競爭對手通過惡意Bot搶票,再退票,讓企業業務無法開展,造成損失。
(5) 活動作弊
無論企業想舉辦什么線上活動,惡意Bot都是一大威脅。通常情況下,企業都會設置一些簡單的防刷策略,但無法完全避免被羊毛黨薅羊毛。像零元購、秒殺、搶紅包、優惠券,被羊毛黨薅走的事情屢見不鮮。
防御惡意Bot
既然惡意Bot會嚴重影響企業正常業務,那么該怎么防御呢?一般可采取六種方法。
(1) 限制源IP
直接限制源IP的請求速度,簡單粗暴。這種方式有一定風險,例如在秒殺、搶購活動中,瞬間請求激增,如果源IP請求被限制,誤報率很高。比起惡意Bot,過高的誤報率反而會造成更嚴重的后果。限制源IP一般只作為輔助手段。
(2) Cookie支持
Cookie支持可識別一些比較簡單的Bot程序。簡單的Bot程序不支持Cookie,我們可以在服務端寫入Cookie的方式,來識別是否是Bot。由于Bot支持Cookie的時間成本很低,所以這一方式的效果較為有限。
(3) Bot行為分析
由于惡意Bot是通過模仿正常用戶行為進行請求,具備一定的特征,通過分析和識別這些特征,即可檢測出惡意Bot。
但“行為”是一個抽象概念,判斷難度較高,一般企業難以投入大量時間和精力研究,只有專門從事安全工作的公司,會做出行為分析方案。例如蔚可云的“BotGuard爬蟲管理”,可通過情報庫、訪問控制、陷阱誘導、人機交互、機器學習等技術,對訪客進行行為分析,識別惡意Bot。
(4) IP情報信息分析
正常流量在相近的一段時間內,行為是正常的,而異常IP則不同。例如被用來發動DDoS的一臺肉雞,并不會只用來發動一次攻擊,而是會在一段時間內,一直處于攻擊狀態。通過大數據分析技術,對歷史事件進行威脅分析,能提前發現惡意Bot,并進行防御。
《第47次互聯網絡發展統計報告》顯示,網站安全事件和信息系統漏洞,正在逐年減少,例如網站被篡改數量,2020年較2019年同期下降22.7%,但惡意Bot卻在逐年增加,已成為企業不可忽視的一股黑產勢力,防御惡意Bot任重而道遠。