Python數據可視化:25年GDP之變
說實話,這一期起的有點標題黨了。
用到的Python知識并不多,只是利用Python對數據進行規整。
最多的應該是用大佬造的輪子,基于D3.js的數據可視化項目。
附上大佬的GitHub地址,有興趣的小伙伴可以自行去圍觀。
- https://github.com/Jannchie/Historical-ranking-data-visualization-based-on-d3.js
最后我利用大佬造的輪子,成功實現了25年間各省市GDP數據的可視化。
于是乎,你不就對各省市的GDP了解的一清二楚。
數據來源來自國家統計局。
附上相關鏈接,其實里面還有好多其他的數據,非常適合拿去練手。
- http://data.stats.gov.cn/easyquery.htm?cn=E0103
本次的GDP數據如下,為各地區生產總值。
時間是1993年-2017年,共25年。
網站提供CSV文件下載,但是還是需要規整一下數據。
因為大佬造的輪子對數據有要求。
同時還需要注意一下編碼問題,這里的CSV文件需要用gbk編碼。
下面是從統計局下載下來的CSV數據。
我偷了個懶,直接就先在表格里刪除了前三行,如下。
接下來便是用Python對數據進行規整,代碼如下。
- import pandas as pd
- # 讀取數據
- df = pd.read_csv('gdp.csv', encoding='utf-8')
- (names, values, dates) = ([], [], [])
- # 記得去除地區這個列名,遍歷年份
- for i in df.columns[1:]:
- for j, k in zip(df[i], df['地區']):
- # 輸出地區、GDP值、年份數據
- print(k, j, i)
- names.append(k)
- values.append(int(j))
- dates.append(int(i.replace('年', '')))
- # 生成DateFrame格式的數據
- data = {
- 'name': names,
- 'type': '',
- 'value': values,
- 'date': dates
- }
- # 將數據轉存為新的CSV文件
- frame = pd.DataFrame(data)
- # 設置編碼格式,避免亂碼
- frame.to_csv('gdp_last.csv', encoding='utf_8_sig')
獲取的CSV數據如下。
和大佬造的輪子所需數據格式是一樣的,這里我不設置類型。
接下來就是克隆大佬的項目代碼到你的計算機里。
這里以前我只是上傳代碼,沒有去下載項目代碼,所以不是很清楚怎么下載下來。
經過這次算是學會了。
首先安裝一下GitHub Desktop,然后用你的GitHub賬號登陸它。
配置一下你的用戶名及綁定郵箱,便能克隆其他人的項目到你的本地。
然后打開src目錄下的bargraph.html,瀏覽器就會打開一個網頁。
在網頁里點擊選擇文件,把文件上傳上去就成功了。
網頁上就會有動態視頻出現,如下。
是不是發現很有意思,哈哈。
這里我根據自己個人需要,對大佬的輪子進行了修改。
修改的地方是在src目錄下的config.js文件里。
主要是一些小細節的修改,比如最多顯示的條目數,標題,以及條目的顏色。
修改的文件及我的CSV文件都已經上傳到GitHub上頭了。
有興趣的小伙伴可以自行去圍觀,通過閱讀原文即可直接到我的GitHub。