成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

總結了Pandas實現數據清洗的7種方式

大數據 數據分析
最近在做“對比excel,學習pandas系列”,今天給大家介紹一下excel和pandas實現數據清洗的種方式。

 最近在做“對比excel,學習pandas系列”,前面發了一篇 很受讀者喜愛,今天給大家介紹一下excel和pandas實現數據清洗的種方式

1.處理數據中的空值

我們在處理真實的數據時,往往會有很多缺少的的特征數據,就是所謂的空值,必須要進行處理才能進行下一步分析

空值的處理方式有很多種,一般是刪除或者填充

Excel通過“查找和替換”功能實現空值的統一替換:

通過“定位”刪除空值:

pandas處理空值的方式比較靈活,可以使用dropna函數刪除空值

  1. import pandas as pd 
  2. data=pd.read_csv('成績表.csv',encoding='gbk'
  3. data.dropna(how='any'

用fillna函數實現空值的填充

①使用數字0填充數據表中的空值

  1. data.fillna(value=0)   

②使用平均值填充數據表中的空值

  1. data['語文'].fillna(data['語文'].mean()) 

2.刪除空格

excel中清理空格很簡單,直接替換即可

pandas刪除空格也很方便,主要使用map函數

  1. data['姓名']=data['姓名'].map(str.strip) 
  2. data 

3.大小寫轉換

excel中大小寫轉換函數分別為upper()和lower()

pandas中轉換函數也為upper()和lower()

  1. data['拼音']=data['拼音'].str.upper() 
  2. data 

  1. data['拼音']=data['拼音'].str.lower() 
  2. data 

4.更改數據格式

excel中更改數據格式通過快捷鍵“ctrl+1”打開“設置單元格格式”:

pandas使用astype來修改數據格式,以將“語文”列改成整數為例

  1. data['語文'].dropna(how='any').astype('int'

5.更改列名稱

excel中更改列名稱就不說了,大家都會

pandas使用rename函數更改列名稱,代碼如下:

  1. data.rename(columns={'語文':'語文成績'}) 

6.刪除重復值

excel的功能區“數據”下有“刪除重復項”,可以用來刪除表中的重復值,默認保留最第一個重復值,把后面的刪除:

pandas使用drop_duplicates函數刪除重復值:

  1. data['數學'].drop_duplicates() #默認刪除后面的重復值 
  2.  
  3. data['數學'].drop_duplicates(keep='last') #刪除第一項重復值 

7.修改及替換數據

excel中使用“查找和替換”功能實現數值的替換

pandas中使用replace函數實現數據替換

  1. data['姓名'].replace('成  功','失  敗'

 本文轉載自微信公眾號「python數據分析之禪」,可以通過以下二維碼關注。轉載本文請聯系python數據分析之禪公眾號。

 

責任編輯:武曉燕 來源: python數據分析之禪
相關推薦

2023-02-27 22:03:06

數據庫內存RocketMQ

2024-10-28 12:57:36

Pandas數據清洗

2022-07-11 13:30:08

Pandas數據編碼代碼

2022-04-20 15:10:55

pandas編碼函數

2021-08-25 07:47:53

Pandas函數數據處理

2022-03-11 12:31:04

Vue3組件前端

2022-04-28 18:47:04

Pandas函數Python

2009-07-02 14:42:55

ExtJS Grid

2022-03-09 18:09:47

前端CSS代碼

2024-11-20 07:00:00

代碼數據清洗Python

2021-04-09 16:22:39

云計算

2019-05-16 13:00:18

異步編程JavaScript回調函數

2018-09-09 15:13:53

2020-11-20 14:02:22

HashMap遍歷Java

2023-09-26 01:03:36

Pandas數據數據集

2018-04-03 12:07:53

數據清洗PandasNumpy

2021-05-17 09:31:58

爬蟲偽裝技巧

2023-12-12 11:06:37

PythonPandas數據

2022-08-05 08:27:05

分布式系統線程并發

2024-06-13 11:54:03

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: av免费电影在线 | 欧洲色| 欧美中文字幕一区二区 | 欧美成人不卡 | 日韩精品免费视频 | 欧美一级久久精品 | 成人免费视频 | 国产视频第一页 | 亚洲精品电影网在线观看 | 国产一区二区三区视频免费观看 | 国产玖玖 | 性做久久久久久免费观看欧美 | 精品视频导航 | 在线观看免费av网站 | 亚洲一区二区日韩 | 五月激情六月婷婷 | 一级片片| 精品免费视频 | 亚洲国产高清在线 | 日韩午夜网站 | 久久久国产精品 | 久久国产精品偷 | 欧美色综合网 | 中文字幕一级毛片视频 | 国产精品免费在线 | 日韩精品视频一区二区三区 | 欧美一级二级在线观看 | 九九热免费视频在线观看 | 91xxx在线观看| 国产精品久久二区 | 成人在线a | 一区二区视频在线 | 四色永久 | 亚洲精品福利视频 | 亚洲导航深夜福利涩涩屋 | 国产女人精品视频 | 围产精品久久久久久久 | www.久| 91色视频在线观看 | 亚洲综合第一页 | 欧美人人 |