成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

數據分析實戰:使用Python分析新型冠狀病毒的發展趨勢

開發 后端 大數據
這次疫情的情況大家也都了解了,各地也都延遲開學或者延遲開工,對于我們來說,正好是一次深入學習的機會。今天,我就帶領大家分析一下新型冠狀病毒的爆發趨勢,也借此作為一次數據分析課程的實戰案例,從 數據獲取、數據清洗、數據可視化再到產出數據結論,完整的走一遍數據分析流程。

這次疫情的情況大家也都了解了,各地也都延遲開學或者延遲開工,對于我們來說,正好是一次深入學習的機會。今天,我就帶領大家分析一下新型冠狀病毒的爆發趨勢,也借此作為一次數據分析課程的實戰案例,從 數據獲取、數據清洗、數據可視化再到產出數據結論,完整的走一遍數據分析流程。

這次使用的數據是霍普金斯大學收集的世界范圍內的病毒爆發數據。

導入所需的包和數據

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

數據清洗

第一:刪除不需要的數據列

從數據中我們可以看出,第一列相當于編號,第五列是數據更新的最后時間,這兩列對我們的分析來說沒有實際意義,所以先把這兩列進行刪除操作:

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

第二:對數據集中的空值進行處理

先來看一下數據的整體情況:

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

我們發現,只有省份這一個字段是有空值的,那我們再來看一下具體的空值有哪些:

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

經過篩選發現,空缺的都是一些國外的省份,這是由于數據收集過程中產生的,并且我們無從推斷到底是什么,所以,這里的空值我們選擇不處理。

第三:刪除重復數據

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

通過使用dumplicate方法,我們發現這個人工整理的數據集不存在重復情況,所以也不需要進行去重操作。

數據洞察

我們首先來看一下,截止到數據完成時間,世界上總共有多少國家已經「淪陷」了:

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

通過統計發現,總共只有32個國家已經有了確診患者,但是,細心的同學可能會發現,國家列表當中有「China」和「Mainland China」,第二個表示的是「中國大陸」,其實也是中國,所以我們應該把「Mainland China」也改為「China」統一口徑,在實際工作過程中,跨部門的數據經常會出現這種情況,所以,處理這種數據噪音也是數據分析師的日常工作之一。

接著,我們看一下時間字段,時間字段的處理也是數據分析過程中不可或缺的一個步驟:

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

這里的時間,都是精確到「小時」的,為了便于統計,我們把它改成精確到「日」:

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

接下來,我們以國家作為維度,來統計一下每個國家的確診人數:

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

排名第一的肯定是中國,排名靠前的基本都是中國臨近的亞洲國家,歐美國家當中,排名第一的是德國,如果是真正工作過程中,德國這一點就是「異常點」,肯定要深入挖掘,在這里我們只是做一個示例。

之后我們以時間作為維度,分析一下每天的感染人群數量的變化:

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

從這里可以看到,14天之內感染人數就從555人增長到24503個人,增長速度還是很快的,那我們接著也要具體分析一下,每天新增的確診人數有多少人,這里我們需要用到diff( )方法:

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

數據可視化

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

首先來看每天的確診人數,基本上是指數增長的一個走勢,符合傳染病的爆發規律,我們要做的就是根據之后的數據,洞察拐點的到來。

 

數據分析實戰:使用python分析新型冠狀病毒的發展趨勢

接著,我們看一下,每天的「死亡人數」和「治愈人數」的走勢,從這個數據上來看,治愈人數的增長趨勢已經超過的死亡人數,所以,從「最好」和「最壞」兩個方面來說的話,總體趨勢還是向好發展,大家也不必過于擔心。

總結

以上分析只是拋磚引玉,使用一部分數據來引導大家參與到數據分析的實戰流程當中,歡迎大家在留言區一起討論學習。

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2020-06-08 10:17:37

數據分析冠狀病毒機器學習

2020-02-06 12:37:59

新型冠狀病毒勒索病毒病毒

2021-04-25 15:19:19

數據分析商業智能大數據

2020-03-27 09:49:50

數據中心運營商新型冠狀病毒

2020-04-29 11:32:31

NEC

2020-03-27 09:10:49

新型冠狀病毒遠程網絡

2020-02-14 10:20:41

物聯網傳染病數據

2020-01-30 14:55:15

肺炎疫情數據

2020-07-07 10:00:00

技術

2023-10-10 12:34:06

SQL分析職業

2020-03-09 21:02:26

疫情NAND閃存存儲

2009-09-24 10:25:30

Hibernate發展

2020-03-03 09:34:22

聯想

2020-02-28 09:17:16

冠狀病毒移動安全病毒

2020-02-05 18:13:22

IBM

2020-06-02 16:34:57

區塊鏈新型冠狀病毒區塊鏈技術

2020-02-04 19:26:08

人工智能AI新型冠狀病毒

2020-03-20 20:24:52

人工智能AI新型疫情

2019-02-19 10:50:51

Java開發代碼

2019-12-16 13:49:45

智慧城市物聯網基礎設施
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品久久久久久久毛片 | 亚洲精品1区2区3区 91免费看片 | 视频一区二区中文字幕日韩 | 9999国产精品欧美久久久久久 | 韩日一区二区三区 | 中文av字幕 | 91成人免费看片 | 日韩人体在线 | 五月婷婷激情 | 在线中文字幕av | 国产一区二区在线视频 | 国产精品国产三级国产a | 日韩免费av网站 | 午夜爽爽爽男女免费观看 | 男女污污网站 | 亚洲精品视频在线 | 日韩欧美一区二区三区免费观看 | 国产清纯白嫩初高生视频在线观看 | 国产天堂 | 国产午夜精品一区二区三区 | 一区二区三区四区免费视频 | 欧美在线激情 | 欧州一区二区三区 | 国产精品视频不卡 | 久久av一区二区三区 | 亚洲成人一区二区三区 | 久久伊人操 | 伊人久久精品一区二区三区 | 午夜影院视频 | 日韩成人一区 | 毛片一区二区三区 | 亚洲视频免费在线观看 | 一级黄色录像片子 | 日韩和的一区二在线 | 日韩欧美国产一区二区三区 | 久久精品视频在线免费观看 | 午夜影院在线观看 | 日本精品一区二区三区在线观看视频 | 欧美成人综合 | 久久久久国产精品人 | 亚洲欧美精品在线观看 |