五個令人驚嘆的Jupyter黑科技
Jupyter是一種功能強大的交互式計算環境,被廣泛應用于數據分析、機器學習、科學計算等領域。除了常見的基本功能外,Jupyter還隱藏著許多令人驚嘆的黑科技,這些功能可以幫助用戶更高效地完成工作,提升工作體驗。在本文中,筆者總結了五個Jupyter黑科技,與大家分享。
GUI自動生成代碼Visual Python
VisualPython是一個開源項目,它是一款基于圖形界面(GUI)的「Python代碼生成器」,在 Jupyter Notebook 上作為擴展插件使用。
VisualPython的初衷是為那些在數據科學課程中為編碼而苦苦掙扎的學生而開發。對于程序員而言,使用該工具可以保存和重用用戶代碼;非程序員使用該工具,可以更輕松地學習 Python 語言,以最少的編碼技能探索和利用數據科學解決實際問題。
主要特征包括:
- 基于圖形界面自動生成 Python 代碼。
- 可以按任務創建代碼塊,如數據處理任務、可視化任務等。
- 可以將分析過程導出為 .vp 文件與他人共享。
Jupyter Notebook環境安裝并激活visualpython,即可看到開發界面工具欄的最右邊多了一個黃色的小方塊按鈕,這個小方塊就是Visual Python提供的功能。點擊黃色的小方塊即可直接進入到無代碼的拖拽式開發頁面了,代碼開發頁面和組件拖拽會同時出現在編輯頁面中。如下圖所示。
編Pandas代碼時生成有用的提示
使用未優化的pandas通常會減慢數據分析速度,此時可以使用Dovpanda工具,提供有關數據操作步驟的建議或警告。
Jupyter單元格執行完成后獲取通知
在Jupyter單元格中運行一些代碼后,經常會導航到其他工作區。此時,必須不斷返回Jupyter標簽,以檢查單元格是否已執行。
為了避免這種情況的發生,則可以使用jupyternotify中的%%notify魔法命令在瀏覽器通知用戶Jupyter單元格的執行情況。這對于長時間運行的代碼或者需要監控執行情況的代碼來說非常方便。
每當單元格完成其執行時,將收到以下通知,單擊通知又可以回到Jupyter標簽。
深入挖掘數據信息
通常,在Jupyter中加載DataFrame時,會打印預覽數據,如下所示:
然而,它幾乎沒有告訴我們數據內部的任何信息。此時,可以使用Jupyter-DataTables深入挖掘數據信息。如下圖所示,通過預覽可以看到排序、過濾、導出和分頁操作等數據信息。
一鍵標記數據
處理未標記的數據是,可以使用ipyannotate,在幾行代碼中進行注釋,然后通過點擊按鈕進行數據標注。如下所示。