這個ChatGPT插件可以遠程運行代碼,還生成圖表
ChatGPT的插件使數據科學成為一種簡單、愉快的體驗
我們做數據分析時一般都是使用這樣的流程來進行:運行jupyter notebook、安裝庫、解決依賴關系和版本控制,數據分析,生成圖表。ChatGPT的“Code Interpreter”插件可以幫助我們進行數據分析。
作為測試,首先要ChatGPT進入角色,讓它作為經濟顧問。
act as an economic advisor and help me understand what is essential for calculating inflation.
1、加載和預處理數據
要求ChatGPT訪問歷史數據并開始對其進行預測。它告訴我它將使用FRED(聯邦儲備經濟數據)數據庫,但不幸的是,它無法下載數據。
那么我們來幫它下載,詢問如何下載數據。
然后將它上傳給Code Interpreter,就可以進行EDA了。
在ChatGPT的幫助下,我可視化了數據,檢查了趨勢,并探索了關鍵指標。ChatGPT用簡單的英語進行了總結。
哈哈,ChatGPT什么都知道。
2、數據分析:它繪制了時間序列數據,直觀地探索CPI值的趨勢和季節性。
它使用增強Dickey-Fuller (ADF)檢驗平穩性。結果表明,原始時間序列是非平穩的。
3、數據轉換的平穩性
為了實現平穩性,它對時間序列數據應用了一階差分,這涉及到計算連續觀測數據之間的差異。它對不同的數據使用ADF檢驗重新檢驗平穩性。結果表明,差分時間序列是平穩的。
4、模型選擇與參數估計
下一步是預測五年的CPI。ChatGPT向我介紹了ARIMA模型,它分析了這些數字,給了我一個有意義的預測!
它設置檢查了自相關函數(ACF)和部分自相關函數(PACF)圖,來確定ARIMA模型的順序(參數p, d, q)。根據ACF和PACF圖,選取參數p=1, d=1, q=1的初始ARIMA模型。
5、模型訓練
它用所選參數(p=1, d=1, q=1)將ARIMA模型擬合到原始(無差異)時間序列數據。該模型從歷史數據模式中學習。
6、預測
使用擬合的ARIMA模型從最后一個數據點預測未來5年(60個月)的CPI。還生成點預測和置信區間,以解釋預測中的不確定性。
7、可視化和解釋
繪制歷史數據、預測CPI值和置信區間,在通貨膨脹趨勢的背景下解釋預測值,理解預測受到不確定性和外部因素的影響。
插件系統的確讓ChatGPT變得有趣:“Code Interpreter”不僅可以讓遠程運行代碼,而且還使數據科學簡單,高效。
無論你是經驗豐富的數據科學家還是剛入門的新手,都可以嘗試一下ChatGPT。智能不智能要看后續的驗證結果,但是省事是真省事。