成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

在Python調試過程中設置不中斷的斷點

開發 后端
你對如何讓調試器變得更快產生過興趣嗎?本文將分享我們在為 Python 構建調試器時得到的一些經驗。

[[318424]]

你對如何讓調試器變得更快產生過興趣嗎?本文將分享我們在為 Python 構建調試器時得到的一些經驗。

整段故事講的是我們在 Rookout 公司的團隊為 Python 調試器開發不中斷斷點的經歷,以及開發過程中得到的經驗。我將在本月于舊金山舉辦的 PyBay 2019 上介紹有關 Python 調試過程的更多細節,但現在就讓我們立刻開始這段故事。

Python 調試器的心臟:sys.set_trace

在諸多可選的 Python 調試器中,使用最廣泛的三個是:

  • pdb,它是 Python 標準庫的一部分
  • PyDev,它是內嵌在 Eclipse 和 Pycharm 等 IDE 中的調試器
  • ipdb,它是 IPython 的調試器

Python 調試器的選擇雖多,但它們幾乎都基于同一個函數:sys.settrace。 值得一提的是, sys.settrace 可能也是 Python 標準庫中最復雜的函數。

 

set_trace Python 2 docs page

簡單來講,settrace 的作用是為解釋器注冊一個跟蹤函數,它在下列四種情形發生時被調用:

  • 函數調用
  • 語句執行
  • 函數返回
  • 異常拋出

一個簡單的跟蹤函數看上去大概是這樣:

  1. def simple_tracer(frame, event, arg):
  2.   co = frame.f_code
  3.   func_name = co.co_name
  4.   line_no = frame.f_lineno
  5.   print("{e} {f} {l}".format(
  6. e=event, f=func_name, l=line_no))
  7.   return simple_tracer

在分析函數時我們首先關注的是參數和返回值,該跟蹤函數的參數分別是:

  • frame,當前堆棧幀,它是包含當前函數執行時解釋器里完整狀態的對象
  • event,事件,它是一個值可能為 callline、return 或 exception 的字符串
  • arg,參數,它的取值基于 event 的類型,是一個可選項

該跟蹤函數的返回值是它自身,這是由于解釋器需要持續跟蹤兩類跟蹤函數:

  • 全局跟蹤函數(每線程):該跟蹤函數由當前線程調用 sys.settrace 來設置,并在解釋器創建一個新的堆棧幀時被調用(即代碼中發生函數調用時)。雖然沒有現成的方式來為不同的線程設置跟蹤函數,但你可以調用 threading.settrace 來為所有新創建的 threading 模塊線程設置跟蹤函數。
  • 局部跟蹤函數(每一幀):解釋器將該跟蹤函數的值設置為全局跟蹤函數創建幀時的返回值。同樣也沒有現成的方法能夠在幀被創建時自動設置局部跟蹤函數。

該機制的目的是讓調試器對被跟蹤的幀有更精確的把握,以減少對性能的影響。

簡單三步構建調試器 (我們最初的設想)

僅僅依靠上文提到的內容,用自制的跟蹤函數來構建一個真正的調試器似乎有些不切實際。幸運的是,Python 的標準調試器 pdb 是基于 Bdb 構建的,后者是 Python 標準庫中專門用于構建調試器的基類。

基于 Bdb 的簡易斷點調試器看上去是這樣的:

  1. import bdb
  2. import inspect
  3.  
  4. class Debugger(bdb.Bdb):
  5.   def __init__(self):
  6.       Bdb.__init__(self)
  7.       self.breakpoints = dict()
  8.       self.set_trace()
  9.  
  10. def set_breakpoint(self, filename, lineno, method):
  11.   self.set_break(filename, lineno)
  12.   try :
  13.       self.breakpoints[(filename, lineno)].add(method)
  14.   except KeyError:
  15.       self.breakpoints[(filename, lineno)] = [method]
  16.  
  17. def user_line(self, frame):
  18.   if not self.break_here(frame):
  19.       return
  20.  
  21.   # Get filename and lineno from frame
  22.   (filename, lineno, _, _, _) = inspect.getframeinfo(frame)
  23.  
  24.   methods = self.breakpoints[(filename, lineno)]
  25.   for method in methods:
  26.       method(frame)

這個調試器類的全部構成是:

  1. 繼承 Bdb,定義一個簡單的構造函數來初始化基類,并開始跟蹤。
  2. 添加 set_breakpoint 方法,它使用 Bdb 來設置斷點,并跟蹤這些斷點。
  3. 重載 Bdb 在當前用戶行調用的 user_line 方法,該方法一定被一個斷點調用,之后獲取該斷點的源位置,并調用已注冊的斷點。

這個簡易的 Bdb 調試器效率如何呢?

Rookout 的目標是在生產級性能的使用場景下提供接近普通調試器的使用體驗。那么,讓我們來看看先前構建出來的簡易調試器表現的如何。

為了衡量調試器的整體性能開銷,我們使用如下兩個簡單的函數來進行測試,它們分別在不同的情景下執行了 1600 萬次。請注意,在所有情景下斷點都不會被執行。

  1. def empty_method():
  2.    pass
  3.  
  4. def simple_method():
  5.    a = 1
  6.    b = 2
  7.    c = 3
  8.    d = 4
  9.    e = 5
  10.    f = 6
  11.    g = 7
  12.    h = 8
  13.    i = 9
  14.    j = 10

在使用調試器的情況下需要大量的時間才能完成測試。糟糕的結果指明了,這個簡陋 Bdb 調試器的性能還遠不足以在生產環境中使用。

 

First Bdb debugger results

對調試器進行優化

降低調試器的額外開銷主要有三種方法:

  1. 盡可能的限制局部跟蹤:由于每一行代碼都可能包含大量事件,局部跟蹤比全局跟蹤的開銷要大得多。
  2. 優化 call 事件并盡快將控制權還給解釋器:在 call 事件發生時調試器的主要工作是判斷是否需要對該事件進行跟蹤。
  3. 優化 line 事件并盡快將控制權還給解釋器:在 line 事件發生時調試器的主要工作是判斷我們在此處是否需要設置一個斷點。

于是我們復刻了 Bdb 項目,精簡特征、簡化代碼,針對使用場景進行優化。這些工作雖然得到了一些效果,但仍無法滿足我們的需求。因此我們又繼續進行了其它的嘗試,將代碼優化并遷移至 .pyx 使用 Cython 進行編譯,可惜結果(如下圖所示)依舊不夠理想。最終,我們在深入了解 CPython 源碼之后意識到,讓跟蹤過程快到滿足生產需求是不可能的。

 

Second Bdb debugger results

放棄 Bdb 轉而嘗試字節碼操作

熬過先前對標準調試方法進行的試驗-失敗-再試驗循環所帶來的失望,我們將目光轉向另一種選擇:字節碼操作。

Python 解釋器的工作主要分為兩個階段:

  1. 將 Python 源碼編譯成 Python 字節碼:這種(對人類而言)不可讀的格式專為執行的效率而優化,它們通常緩存在我們熟知的 .pyc 文件當中。
  2. 遍歷 解釋器循環中的字節碼: 在這一步中解釋器會逐條的執行指令。

我們選擇的模式是:使用字節碼操作來設置沒有全局額外開銷的不中斷斷點。這種方式的實現首先需要在內存中的字節碼里找到我們感興趣的部分,然后在該部分的相關機器指令前插入一個函數調用。如此一來,解釋器無需任何額外的工作即可實現我們的不中斷斷點。

這種方法并不依靠魔法來實現,讓我們簡要地舉個例子。

首先定義一個簡單的函數:

  1. def multiply(a, b):
  2.    result = a * b
  3.    return result

inspect 模塊(其包含了許多實用的單元)的文檔里,我們得知可以通過訪問 multiply.func_code.co_code 來獲取函數的字節碼:

  1. '|\x00\x00|\x01\x00\x14}\x02\x00|\x02\x00S'

使用 Python 標準庫中的 dis 模塊可以翻譯這些不可讀的字符串。調用 dis.dis(multiply.func_code.co_code) 之后,我們就可以得到:

  1.   4          0 LOAD_FAST               0 (a)
  2.              3 LOAD_FAST               1 (b)
  3.              6 BINARY_MULTIPLY    
  4.              7 STORE_FAST              2 (result)
  5.  
  6.   5         10 LOAD_FAST               2 (result)
  7.             13 RETURN_VALUE      

與直截了當的解決方案相比,這種方法讓我們更靠近發生在調試器背后的事情??上?Python 并沒有提供在解釋器中修改函數字節碼的方法。我們可以對函數對象進行重寫,不過那樣做的效率滿足不了大多數實際的調試場景。最后我們不得不采用一種迂回的方式來使用原生拓展才能完成這一任務。

總結

在構建一個新工具時,總會學到許多事情的工作原理。這種刨根問底的過程能夠使你的思路跳出桎梏,從而得到意料之外的解決方案。

在 Rookout 團隊中構建不中斷斷點的這段時間里,我學到了許多有關編譯器、調試器、服務器框架、并發模型等等領域的知識。如果你希望更深入的了解字節碼操作,谷歌的開源項目 cloud-debug-python 為編輯字節碼提供了一些工具。 

責任編輯:龐桂玉 來源: Linux中國
相關推薦

2010-11-11 09:40:34

BUG

2009-09-27 08:57:29

Visual Stud

2019-06-04 06:02:25

滲透測試漏洞腳本

2009-11-25 10:23:57

VS2003環境

2015-11-26 13:11:24

javascript原型鏈作用域

2009-02-27 11:36:25

面試成績

2010-07-01 14:05:43

SNMPMIB

2010-03-15 09:11:25

Python編程版面

2023-09-11 17:39:35

SSH服務TCP

2015-08-05 15:42:10

程序員面試問題

2009-10-09 10:21:31

Visual Stud

2019-08-05 09:15:39

Java程序員設計

2024-01-03 16:28:46

WinDbg命令調試

2013-10-18 09:30:04

OSPF協議OSPF

2010-03-17 09:11:01

Python安裝 配置

2013-04-03 10:42:46

iOS開發調試運行代碼

2010-06-04 17:03:17

實現Hadoop

2017-05-08 16:30:51

公共云宕機云計算

2017-12-18 16:50:26

Gobug編譯

2010-03-16 15:57:26

Python二維數組
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文天堂在线观看 | 久久国产欧美日韩精品 | 欧美成人精品在线 | 国产精品亚洲第一区在线暖暖韩国 | 久久久久资源 | 一区二区在线不卡 | 拍真实国产伦偷精品 | av一区二区三区 | 成人免费视频一区二区 | 成人久久久 | 日本亚洲精品成人欧美一区 | 欧美一区二区三区视频 | 视频1区| 国产精品久久久久久久久大全 | 中文字字幕一区二区三区四区五区 | 国产欧美精品一区二区色综合朱莉 | 亚洲一区视频在线 | 久久国产欧美日韩精品 | 一区二区三区高清不卡 | 日韩视频免费看 | 乱码av午夜噜噜噜噜动漫 | 美女高潮网站 | 国产一区二区三区视频在线观看 | 中文字幕11页 | 日韩国产欧美视频 | 国产国产精品久久久久 | 国产伦一区二区三区视频 | 亚洲欧美一区二区三区视频 | 欧美日韩在线精品 | 毛片综合 | 亚洲日韩视频 | 欧美精品一区二区在线观看 | 男人天堂网址 | 亚洲欧美一区二区三区国产精品 | 四虎影院在线播放 | 一级片片 | 日韩一区二区三区在线观看 | 91在线视频观看免费 | 男人av网 | 91久久婷婷 | 国产一二三区免费视频 |