成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

我修復了Pandas包的一個bug

開發 后端
這篇文章介紹Pandas中一個bug,昨天研究了此bug出現的原因,及修改措施。感興趣的可以看一下,或許在日后能對你有一些幫助。

你好,我是zhenguo,今天說個開心事~  

1. 還原這個bug

導出含有層級關系的列頭時,會多寫出一個空行,此bug穩定出現。

2. 定位問題

經過調試發現,鎖定此bug出現的位置到excel.py模塊,如下所示:

理一理excel.py模塊封裝的方法,經過調試發現,write方法中下面幾行代碼是關鍵邏輯:

寫入到excel過程,實際是逐個單元格寫入到excel過程,主要調用封裝的get_formatted_cells方法得到formatted_cells。

formatted_cells = self.get_formatted_cells()
writer.write_cells(
formatted_cells,
sheet_name,
startrow=startrow,
startcol=startcol,
freeze_panes=freeze_panes,
)

再進去看看get_formatted_cells方法,它使用chain串接了兩個生成器,然后逐一yield吐出cell:

def get_formatted_cells(self):
for cell in itertools.chain(self._format_header(), self._format_body()):
cell.val = self._format_value(cell.val)
yield cell

而串接的這兩個迭代器,一個是self._format_header(),另一個是self._format_body()。

經過調試,在這里就能找到bug出現的原因,self._format_body()是有問題的,經過格式化數據域部分。拿文章一開始的case舉例,取值為a的單元格對應的行索引被錯誤的標記為3,注意行索引是從0開始的。很明顯,實際應該是2。

3. 修復bug

找到原因后,進一步下鉆到底層方法,經過調試,進一步鎖定到self._format_body()中調用的 _format_regular_rows方法,里面與行編號相關聯的屬性是self.rowcounter,所以重點關注與它相關的寫入邏輯:

def _format_regular_rows(self):
has_aliases = isinstance(self.header, (tuple, list, np.ndarray, Index))
if has_aliases or self.header:
self.rowcounter += 1
# output index and index_label?
if self.index:
# check aliases
# if list only take first as this is not a MultiIndex
if self.index_label and isinstance(
self.index_label, (list, tuple, np.ndarray, Index)
):
index_label = self.index_label[0]
# if string good to go
elif self.index_label and isinstance(self.index_label, str):
index_label = self.index_label
else:
index_label = self.df.index.names[0]
if isinstance(self.columns, ABCMultiIndex):
self.rowcounter += 1

一共有2處可能的寫入,其中第二處寫入,也就是上面代碼塊的最后兩行,是bug出現的原因。經過仔細分析,在級聯表頭(ABCMultiIndex)寫入excel場景中,行索引已經在self._format_header()中,行索引已經被加1,所以再在此處對其加1,是重復的:

if isinstance(self.columns, ABCMultiIndex):
self.rowcounter += 1

所以修改方法就是對其標注即可。

4. 修復bug后

修復后,經過測試級聯列頭、單列頭,都正常,不再有多余的空行。

以上,此bug我已經提交到github的pandas中,希望幫助到更多的開發者。

我是zhenguo,最后希望點贊+轉發~

責任編輯:龐桂玉 來源: Python小例子
相關推薦

2021-09-13 08:41:52

職場互聯網自閉

2014-12-17 09:40:22

dockerLinuxPaaS

2016-09-28 14:00:56

2022-06-08 08:14:27

Dubbo數據包源代碼

2022-11-30 09:18:51

JavaMyBatisMQ

2021-04-22 07:47:47

JavaJDKMYSQL

2023-05-09 11:02:22

Go內聯版本

2022-07-22 15:40:26

Atlassian服務器漏洞

2024-10-25 12:38:27

2022-04-06 08:47:03

Dubbo服務協議

2022-11-18 14:15:13

2014-11-14 09:36:58

微軟bug

2016-12-14 10:00:44

數據結構編譯器

2020-01-10 09:20:03

手機ISOJDK

2022-05-27 07:03:04

JDK場景線程

2020-11-04 07:56:19

工具Linux 翻譯

2021-04-30 07:09:48

SQLP0事故

2025-02-13 07:00:00

Dubbo-goJava服務端

2020-09-09 12:44:59

Windows 10微軟Bug

2009-09-14 17:08:02

WebFormView
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲国内精品 | 91精品观看 | 国产精品久久久久久久久久免费看 | 国产黄色网址在线观看 | 成人免费淫片aa视频免费 | 中文字幕在线视频精品 | 日韩插插 | 欧美中文字幕一区 | 四虎影院欧美 | 欧美国产精品一区二区三区 | 最新免费视频 | 国产女人与拘做受免费视频 | 欧美一区二区在线播放 | 成人在线免费观看 | 欧美区日韩区 | 国产视频二区 | 欧美日韩国产传媒 | 国产视频中文字幕 | 久久伊人影院 | 992tv人人草| 九九热在线免费观看 | 91人人看 | 91在线电影| www.4hu影院 | 亚洲国产精品久久久久秋霞不卡 | 国产小视频在线 | 精品久久影院 | 久久久久9999 | 日本一区二区高清不卡 | 精品国产一区二区三区性色av | 99精品久久久久久中文字幕 | 免费久 | 亚洲视频国产视频 | 日韩欧美国产精品 | 亚洲一区二区免费 | 秋霞电影一区二区 | 国产精品精品视频一区二区三区 | 中文字幕11页 | 国产成人福利 | 国产精品久久久久久久久久久久久久 | 天堂中文字幕av |