成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

5 個 Pandas 超級好用的隱藏技巧

開發 前端
在本文中,分享五個鮮為人知的 Pandas 技巧。這些技巧初時對我來說非常新穎,需要經過大量研究才能掌握。

對于數據科學來說,Python 中最重要的庫是什么?有些人可能認為是 scikit-learn,它提供了許多內置函數用于機器學習任務。部分人可能會選擇 NumPy 進行數值運算。

但我還是支持 Pandas。為什么?如果你不使用它的功能,你的操作可能會寸步難行。Pandas 非常龐大,需要學習的東西很多。

在本文中,分享五個鮮為人知的 Pandas 技巧。這些技巧初時對我來說非常新穎,需要經過大量研究才能掌握。

1. pipe() 方法鏈

.pipe() 方法鏈可以使代碼更簡潔、更高效。使用.pipe(),可以在一行中應用多個操作。

下面,我們將篩選市場價值高于 1,000,000 歐元的球員數據,并按排序market_value_in_eur,找出世界上最昂貴的球員。

# 這個 transfermarkt 數據集來自 Kaggle(https://www.kaggle.com/datasets/davidcariboo/player-scores)
def  filter_high_value_players ( df ): 
    return df[df[ 'market_value_in_eur' ] > 1000000 ] 

def  sort_by_market_value ( df ): 
    return df.sort_values( 'market_value_in_eur' , accending= False ) 

# 使用 .pipe() 進行方法鏈
filtered_sorted_df = df.pipe(filter_high_value_players).pipe(sort_by_market_value)

2. query()簡化過濾

該query()方法使得過濾數據幀更加容易。無需使用長條件,query()使代碼更具可讀性。

在這里,我們嘗試尋找身價 5000 萬歐元且身高超過 185 歲的足球運動員。

high_value_players_2022 = df2.query("market_value_in_eur > 50000000 和 height_in_cm == 185") 
high_value_players_2022.head(5)

3. eval()加速計算

該eval()函數可以為算術運算提速,特別是對于列式計算非常有用。

# 使用 eval() 計算百萬市值
df[ 'market_value_in_millions' ] = df.eval ( 'market_value_in_eur / 1_000_000' ) 
# 刪除 na df.dropna ( 
subset=[ 'market_value_in_millions' ], inplace= True ) 
# 從最高到最低升序
df.sort_values( "market_value_in_millions" , accending = False )[[ "name" , "market_value_in_millions" ]]

4. astype()優化數據類型

將列轉換為Categorical數據類型可以節省內存并加快操作,并且如果在為機器學習算法處理數據時,這是該方法將是你最佳選擇。

# 將 'player_club_domestic_competition_id' 轉換為分類
df [ 'player_club_domestic_competition_id' ] = df [ 'player_club_domestic_competition_id' ].astype( 'category' )

5. assign()臨時添加列

對于于臨時更改數據列,可以使用assign()方法添加新列而不修改原始數據。

在這里可以看到球員的價值是否高于平均水平。

# 使用assign()添加一列,表示市場價值是否高于平均水平
df_with_new_col = df.assign(above_average = df[ 'market_value_in_millions' ] > df[ 'market_value_in_millions' ].mean()) 
df_with_new_col.head()

圖片圖片

責任編輯:武曉燕 來源: 數據STUDIO
相關推薦

2022-05-10 09:33:50

Pandas技巧代碼

2023-08-18 15:12:00

JavaScript開發

2020-08-14 10:57:49

開發技能代碼

2019-11-20 10:54:32

Python數據結構數據庫

2024-01-03 14:54:56

PythonPandas數據處理工具

2020-06-24 07:44:12

Python數據技術

2023-06-28 00:02:40

2023-12-19 13:31:00

CSS前端技巧

2023-07-18 07:56:31

工具reduce業務

2024-02-26 08:20:00

CSS開發

2020-12-14 08:30:02

JavaScript開發代碼

2015-07-16 14:51:13

下載助手斷點續傳多任務

2020-06-21 13:57:21

JavaScript開發代碼

2020-09-07 08:29:03

CSS 函數JavaScript

2018-04-19 14:30:25

LinuxVi編輯器

2023-03-24 16:41:36

Pandas技巧數據處理

2022-10-19 15:20:58

pandas數據處理庫技巧

2014-11-20 16:02:22

WatchKit

2013-05-27 15:07:36

Eclipse插件

2021-09-22 23:17:09

Java開發數組
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品久久久久久久人人人人传媒 | 中文字幕日韩在线 | 欧美日韩综合精品 | 成年人在线视频 | 午夜三级在线观看 | 国产十日韩十欧美 | 国产精品成人久久久久 | 成人午夜免费网站 | 亚洲欧洲国产视频 | 国产精品久久久久久久久久久久久 | 国产高清精品一区二区三区 | 中文字幕视频在线观看免费 | 日日摸日日碰夜夜爽2015电影 | 一级在线毛片 | 99视频在线 | 国产精品久久一区二区三区 | 亚洲欧洲小视频 | 成人免费看片 | 91影院 | 视频在线观看一区 | 日韩视频在线免费观看 | 精品视频一区二区三区在线观看 | 一区二区三区久久久 | 逼逼网 | 热re99久久精品国99热观看 | 在线播放91| 久久99精品国产自在现线小黄鸭 | 四虎影院一区二区 | 欧美精品一区二区三区在线 | 又黄又爽的网站 | 久久精品亚洲精品国产欧美 | 男女羞羞视频在线免费观看 | 成人在线观看免费观看 | 久久尤物免费一区二区三区 | 欧美亚洲另类在线 | 欧美在线一区二区三区 | 午夜免费电影 | 国产成人影院 | 二区在线视频 | 亚洲高清一区二区三区 | 在线观看成人小视频 |