pandas語法亂、API多?你需要整理一下!
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
pandas作為Python的一個強大擴展庫,被很多人稱為數據分析界的“瑞士軍刀”。
然而,它也被不少學習者詬病:語法很亂!API太多!
有沒有什么好辦法能夠快速上手呢?
為此,有網友在知乎提出這樣的問題:

該問題引起了不少網友的共鳴,很多人也提供了自己上手pandas的方法。
為啥這么亂?
首先來看,大家都吐槽pandas用起來感覺很混亂,那為什么會這樣?
針對這個問題,來自中科院大學的@李丁表示,由于Pandas等Python的科學計算包都是
“一幫學術界人士搞的”,主要是模仿R語言,又沒有模仿到R的靈活語法。最后就是只做
到了功能全面能用就行,沒有關注好不好用等其他代碼工程素養問題。


結果就是雖然它很亂,但是迫于它的“地位”,很多人還是不得不使用它。那大家都是如何上手的呢?
“磨刀不誤砍柴工”
縱觀整個回答,大部分人的思路都是先整體過一遍,腦子里留個印象,到用的時候再去細查!
但是很多東西一遍根本就記不住,查的時候可能都不知道有某個功能,更有人吐槽即使已經用了很久pandas,再用還是需要一遍遍再查官方文檔。
于是,為了提升查詢效率,在初入門時就把各種語法和相關類整理一下非常重要,此所謂“磨刀不誤砍柴工”。


下面是GiHub上一個獲星1.3k的“磨刀”成果:

每一條目錄下都有全面的細化總結,包括示例代碼:

作者是來自阿里巴巴的技術專家。
也有知友更加細化,總結了75個數據分析打工人的Pandas高頻操作:

每一條都說明了具體用法:
實在忍不了試試別的工具
學習計算機,看書是避免不了,除了pandas作者的那本《利用Python進行數據分析》(第2版),還有人強烈推薦《Python數據分析:活用pandas庫》,不過也是不用全部看完,隨用隨查就行。
亞馬遜書評也不錯:
這本書比我讀過的其他介紹Pandas的書好很多,別的書也不錯,但這本書更簡明扼要。作者先介紹方法,接著給出示例,然后繼續推進,非常適合學習。
官方文檔一直被吐槽亂,但是官方網站升級以后的文檔比之前好了一些,該查詢該學習的時候還是得使用它。
剩下的就是在實踐中一次次加深各種用法的記憶了!
當然了,也有一些人推薦直接改用matlab、mathematica,或者效率更高(但比較小眾)的julia。
以及DaPy,一個專門針對pandas數據結構嚴格和api過多等問題的Python數據分析框架,輕量且具有易用性。
你又是如何上手混亂的pandas呢?
知友整理鏈接:
GiHub pandas教程:https://github.com/hangsz/pandas-tutorial
75個Pandas高頻操作:https://mp.weixin.qq.com/s?__biz=MzUwOTg0MjczNw==&mid=2247490395&idx=1&sn=49215a3b51a6768802ba2eae3410e537&chksm=f90d5f05ce7ad613a5200b803580314a298443f98f853a73941ec64ea4a7c90822f1f814cfa9&scene=178&cur_album_id=1429956252289024000#rd