惡意爬蟲正在搞垮你的網站，這屆“網絡流氓”真不好對付

作者：蔚可云 2021-02-24 10:05:49

著名調查機構Aberdeen Group在2019年做過一次調查，真實訪客的流量，只占到全網流量的62.8%，其余的37.2%是機器人(Bot)刷出來的流量。

在整個互聯網中，真實訪客的流量有多少?90%?70%?還是50%?

著名調查機構Aberdeen Group在2019年做過一次調查，真實訪客的流量，只占到全網流量的62.8%，其余的37.2%是機器人(Bot)刷出來的流量。

惡意Bot

在這些Bot流量中，惡意Bot占比高達24.1%，早在2015年，這一數據僅為18.6%。短短5年時間里，惡意Bot占比上升6個百分點，這個比例意味著什么?

如果企業經營一家網站，可能意味著，24%的用戶是假的;策劃一個線上活動，其中24%的獎品，會被Bot刷走;24%的服務器資源會被浪費……

對于一個正在成長的企業而言，是相當致命的。惡意Bot能在各個方面對企業正常業務產生廣泛影響。

(1) 惡意注冊

2020年底，微信發布公告，封禁涉嫌惡意注冊的300萬個賬號，因惡意注冊被封禁的賬號，已經超過620萬個。

如此龐大的注冊數量，將導致企業無法獲得真實的用戶數據，從而在做出決策時，產生偏差。短時間內大量注冊，也會給服務器帶來壓力。惡意注冊的賬號如果在市場上流通，還會給企業帶來政策法規方面的風險。

(2) 非法登錄

2018年，一名英國男子對17個網站發起暴力破解，竊取超過16.5萬條用戶信息，并將它們打包在暗網進行售賣。

通過Bot進行撞庫和暴力破解，攻擊者可以非法獲取賬號敏感信息，例如姓名、手機號等等，可以將這些信息打包販賣。而且還可以盜取賬號資產，或者權限，用于非法目的。

(3) 非法抓取

2019年，今日頭條因為大量抓取百度搜索結果，被百度以不正當競爭為由起訴，索賠9000萬元。

非法抓取大案不止，小案不斷，因為爬蟲抓取他人信息的案件時有發生。站在企業角度上看，被惡意爬蟲光顧，業務核心數據被抓取，對手輕易獲取這些信息，會導致網站競爭力下降。

(4) 惡意刷票

大量惡意刷票搶票Bot，會讓正常用戶無法購買所需的票。競爭對手通過惡意Bot搶票，再退票，讓企業業務無法開展，造成損失。

(5) 活動作弊

無論企業想舉辦什么線上活動，惡意Bot都是一大威脅。通常情況下，企業都會設置一些簡單的防刷策略，但無法完全避免被羊毛黨薅羊毛。像零元購、秒殺、搶紅包、優惠券，被羊毛黨薅走的事情屢見不鮮。

防御惡意Bot

既然惡意Bot會嚴重影響企業正常業務，那么該怎么防御呢?一般可采取六種方法。

(1) 限制源IP

直接限制源IP的請求速度，簡單粗暴。這種方式有一定風險，例如在秒殺、搶購活動中，瞬間請求激增，如果源IP請求被限制，誤報率很高。比起惡意Bot，過高的誤報率反而會造成更嚴重的后果。限制源IP一般只作為輔助手段。

(2) Cookie支持

Cookie支持可識別一些比較簡單的Bot程序。簡單的Bot程序不支持Cookie，我們可以在服務端寫入Cookie的方式，來識別是否是Bot。由于Bot支持Cookie的時間成本很低，所以這一方式的效果較為有限。

(3) Bot行為分析

由于惡意Bot是通過模仿正常用戶行為進行請求，具備一定的特征，通過分析和識別這些特征，即可檢測出惡意Bot。

但“行為”是一個抽象概念，判斷難度較高，一般企業難以投入大量時間和精力研究，只有專門從事安全工作的公司，會做出行為分析方案。例如蔚可云的“BotGuard爬蟲管理”，可通過情報庫、訪問控制、陷阱誘導、人機交互、機器學習等技術，對訪客進行行為分析，識別惡意Bot。

(4) IP情報信息分析

正常流量在相近的一段時間內，行為是正常的，而異常IP則不同。例如被用來發動DDoS的一臺肉雞，并不會只用來發動一次攻擊，而是會在一段時間內，一直處于攻擊狀態。通過大數據分析技術，對歷史事件進行威脅分析，能提前發現惡意Bot，并進行防御。

《第47次互聯網絡發展統計報告》顯示，網站安全事件和信息系統漏洞，正在逐年減少，例如網站被篡改數量，2020年較2019年同期下降22.7%，但惡意Bot卻在逐年增加，已成為企業不可忽視的一股黑產勢力，防御惡意Bot任重而道遠。

責任編輯：趙寧寧來源：今日頭條

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看