成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一日一技:如何正確在 PyCharm 中調試 Scrapy 爬蟲?

開發 項目管理
我們知道,Scrapy 項目要啟動爬蟲的時候,需要在終端或者 CMD 中執行一段命令scrapy crawl 爬蟲名。但是,PyCharm 的調試模式需要以某個.py文件作為入口來運行。

[[404551]]

最近有不少同學在粉絲群里面問,如何調試Scrapy 爬蟲。有些人不知道如何讓 Scrapy 爬蟲進入調試模式;還有一些人不知道怎么單步調試。

怎么進入調試模式

我們知道,Scrapy 項目要啟動爬蟲的時候,需要在終端或者 CMD 中執行一段命令scrapy crawl 爬蟲名。但是,PyCharm 的調試模式需要以某個.py文件作為入口來運行。

為了解決這個問題,我們可以在 Scrapy 項目的根目錄創建一個 main.py文件,然后在里面寫下如下一段代碼:

  1. from scrapy.cmdline import execute 
  2.  
  3. execute('scrapy crawl 爬蟲名'.split()) 

然后,以這個文件作為入口文件,在這個文件上右鍵,選擇Debug 'main',就可以正確啟動 PyCharm 的調試模式并在第一個斷點上停下來了。如下圖所示:

如何正確單步調試

單步調試大家都會,不就是下圖中畫紅框的這兩個按鈕嘛:

左邊是逐行調試,遇到函數直接跳過,右邊是遇到函數進入

但問題是,在 Scrapy 項目里面,如果你的代碼運行到了yield scrapy.Request這種使用yield拋出請求對象的語句,只要再按一下單步調試的按鈕,你就會發現 PyCharm 跳轉到了一個陌生的地方,如下圖所示:

又或者,你的代碼發送了很多次請求,回調函數都到self.parse里面,現在你已經看完第一條請求返回的數據了,斷點停在了第28行,如下圖所示:

現在你想看第二次請求的返回數據,于是你點了一下單步調試,于是你又來到了一個陌生的地方:

這個地方就像一個泥潭,無論你怎么跳出都跳不出來,始終無法回到你自己的代碼中。你越是往外跳,PyCharm 就會打開越多的陌生文件,如下圖所示:

遇到這種情況怎么辦呢?實際上非常簡單,你注意觀察在調試面板上,還有一個按鈕,如下圖箭頭所指:

這個按鈕的功能,是讓 PyCharm 運行的代碼,運行到你當前鼠標光標所在的位置再停下來。所以,例如現在上面圖中的代碼停在了第17行,我想馬上運行到第28行怎么辦?鼠標首先在第28行點一下,如下圖所示箭頭指向的輸入光標:

然后按下這個運行到光標的按鈕,就會發現代碼已經運行到了這一行(是到了這一行,還沒有運行這一行)。接下來你再按一下單步調試按鈕,就能看到 info 變量的值了。看了第一次請求的返回值以后,你想看第二次請求的返回值怎么辦呢?也很好辦,你再一次用鼠標點一下第27行或者第28行,接下來再次點擊運行到當前光標的按鈕,于是第二次請求的結果立刻就出現在了你的面前:

本文轉載自微信公眾號「未聞Code」,可以通過以下二維碼關注。轉載本文請聯系未聞Code公眾號。

 

責任編輯:武曉燕 來源: 未聞Code
相關推薦

2025-05-28 03:15:00

Scrapy數據sleep

2021-09-26 05:01:55

Scrapy項目爬蟲

2024-07-30 08:16:18

Python代碼工具

2020-12-04 06:39:25

爬蟲網頁

2023-10-28 12:14:35

爬蟲JavaScriptObject

2021-10-03 20:08:29

HTTP2Scrapy

2021-07-27 21:32:57

Python 延遲調用

2021-09-14 21:29:01

項目環境變量

2022-03-12 20:38:14

網頁Python測試

2021-10-15 21:08:31

PandasExcel對象

2020-12-11 06:30:00

工具分組DataFrame

2024-10-16 21:47:15

2021-09-13 20:38:47

Python鏈式調用

2021-03-12 21:19:15

Python鏈式調用

2021-12-15 22:04:11

瀏覽器重復登錄

2022-06-28 09:31:44

LinuxmacOS系統

2024-07-30 08:11:16

2022-01-26 07:35:10

爬蟲Requestsgzip

2024-01-29 00:45:36

跨域后端接口

2024-11-11 00:38:13

Mypy靜態類型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 狠狠干影院 | 国产精品99久久久久久宅男 | 亚洲综合小视频 | 亚洲欧美一区二区三区在线 | 亚洲一区二区三区免费视频 | 亚洲国产精品久久久久秋霞不卡 | 国产一区二区自拍 | 国产激情三区 | 国产一区亚洲 | 亚洲精品久久久久久久久久久 | 欧美综合视频在线 | 色射综合| 亚洲一区二区在线视频 | 国家aaa的一级看片 h片在线看 | 国产精品精品久久久 | 欧美不卡 | 国产精品极品美女在线观看免费 | 精品毛片在线观看 | 亚洲一区二区av在线 | 亚洲超碰在线观看 | 亚洲精品在线免费观看视频 | 欧美天堂 | 天天色综网 | 色一情一乱一伦一区二区三区 | 成人福利| 久久夜视频 | 一久久久 | 久草久草久草 | 亚洲一区二区三区国产 | pacopacomama在线 | 91精品国产91久久久久久不卞 | 91国内精精品久久久久久婷婷 | 在线四虎| 国产精品国产精品国产专区不卡 | 日本精品一区二区三区四区 | 久久久久中文字幕 | 日韩成人精品 | 日韩一区二区三区视频在线播放 | 久久久做 | 亚洲成人久久久 | 久久精品一区二区 |