成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

一日一技：誰說 Scrapy 不能爬 HTTP/2?

作者：kingname 2021-10-03 20:08:29

說 HTTP/2協議天然就能防大部分的爬蟲。Python 無論是 requests 還是 Scrapy 都不支持 HTTP/2協議。

之前有一位爬蟲大佬寫了一篇文章，說 HTTP/2協議天然就能防大部分的爬蟲。Python 無論是 requests 還是 Scrapy 都不支持 HTTP/2協議。

Go + HTTP/2[1]這個網站可以檢測你是否使用 HTTP/2協議進行請求。當我們直接使用瀏覽器訪問的時候，頁面長這樣：

注意紅框中的文字

但如果我們直接使用 Scrapy 訪問這個頁面，并打印源代碼，返回的 HTML 長這樣：

注意紅框中的文字

這樣看起來，似乎Scrapy 確實不支持HTTP/2協議?

但我為什么總是一直強調要讀官方文檔，不要去搜索一些垃圾博客呢。因為官方文檔里面，已經明確告訴你Scrapy 不僅原生支持 HTTP/2，而且只需要改一個配置就可以了：Settings — Scrapy 2.5.0 documentation[2]。

更換下載器句柄就可以了

請大家注意上圖中標紅色方框的地方。根據它的描述，我只需要在settings.py文件中，更新下載器句柄(handlers)就可以了。我們來測試一下。把下面這段代碼直接復制到 Scrapy 爬蟲中：

DOWNLOAD_HANDLERS = { 
    'https': 'scrapy.core.downloader.handlers.http2.H2DownloadHandler', 
}

改好以后，重新運行爬蟲，打印出來的源代碼如下圖所示：

可以看到，不需要安裝任何額外的庫。Scrapy 原生就支持 HTTP/2了。

參考文獻

[1] Go + HTTP/2: https://http2.golang.org/

[2] Settings — Scrapy 2.5.0 documentation: https://docs.scrapy.org/en/latest/topics/settings.html#download-handlers-base

責任編輯：武曉燕來源：未聞Code

HTTP 2 Scrapy Python

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：亚洲天堂av在线 | 久久久区 | 亚洲成人精选 | 国产精品久久久久久久久免费高清 | 国产91久久久久久久免费 | 国产精品视频久久 | 日韩中出 | 99精品视频一区二区三区 | 日韩中文字幕在线播放 | 午夜成人在线视频 | 日韩成人在线播放 | 成人国产综合 | 欧美aⅴ| 成人欧美一区二区三区1314 | 久艹网站 | 国产精品污www一区二区三区 | 99福利视频导航 | 99婷婷| 欧美日韩三级在线观看 | av在线成人 | 91秦先生艺校小琴 | 亚洲二区在线 | 日日日干干干 | 国产成人综合一区二区三区 | 久久久免费观看视频 | 国产真实精品久久二三区 | 毛片区| 国产精品欧美一区二区三区 | 久久99国产精一区二区三区 | 精品久久久久久久久久久久 | 国产精品久久久 | 黄色精品 | 久草在线高清 | 久久不射电影网 | 亚洲一区二区三区在线视频 | 国产视频一区二区在线观看 | 成人片免费看 | 久久精品一区二区视频 | 网站黄色在线免费观看 | 亚洲性视频 | 成人免费黄色片 |