成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

5個例子比較Python Pandas 和R data.table

大數(shù)據(jù) 數(shù)據(jù)分析
Python和R是數(shù)據(jù)科學(xué)生態(tài)系統(tǒng)中的兩種主要語言。它們都提供了豐富的功能選擇并且能夠加速和改進(jìn)數(shù)據(jù)科學(xué)工作流程。

在這篇文章中,我們將比較Pandas 和data.table,這兩個庫是Python和R最長用的數(shù)據(jù)分析包。我們不會說那個一個更好,我們這里的重點(diǎn)是演示這兩個庫如何為數(shù)據(jù)處理提供高效和靈活的方法。

[[394697]]

我們將介紹的示例是常見的數(shù)據(jù)分析和操作操作。因此,您可能會經(jīng)常使用它們。

我們將使用Kaggle上提供的墨爾本住房數(shù)據(jù)集作為示例。我將使用谷歌Colab(Pandas )和RStudio(data.table)作為開環(huán)境。讓我們首先導(dǎo)入庫并讀取數(shù)據(jù)集。

 

  1. # pandas  
  2. import pandas as pd  
  3. melb = pd.read_csv("/content/melb_data.csv")  
  4.  
  5. # data.table  
  6. library(data.table)  
  7. melb <- fread("datasets/melb_data.csv"

 

示例1

第一個示例是關(guān)于基于數(shù)據(jù)集中的現(xiàn)有列創(chuàng)建新列。這是特征工程過程中常見的操作。這兩個庫都提供了完成此任務(wù)的簡單方法。

 

  1. # pandas  
  2. melb["Price_per_area"] = melb["Price"] / melb["Landsize"]  
  3.  
  4. # data.table  
  5. melb[, Price_per_area := Price / Landsize] 

 

 

5個例子比較Python Pandas 和R data.table

 

示例2

對于第二個示例,我們通過應(yīng)用幾個過濾器創(chuàng)建原始數(shù)據(jù)集的子集。這個子集包括價(jià)值超過100萬美元,類型為h的房子。

 

  1. # pandas  
  2. subset = melb[(melb.Price > 1000000) & (melb.Type == "h")]  
  3.  
  4. # data.table  
  5. subset <- melb[Price > 1000000 & Type == "h"

 

對于pandas,我們提供dataframe的名稱來選擇用于過濾的列。另一方面,data.table僅使用列名就足夠了。

示例3

在數(shù)據(jù)分析中使用的一個非常常見的函數(shù)是groupby函數(shù)。它允許基于一些數(shù)值度量比較分類變量中的不同值。

例如,我們可以計(jì)算出不同地區(qū)的平均房價(jià)。為了使示例更復(fù)雜一些,我們還對房子類型應(yīng)用一個過濾器。

 

  1. # pandas  
  2. melb[melb.Type == "u"].groupby("Regionname").agg(  
  3. avg_price = ("Price""mean")  
  4. )  
  5.  
  6. # data.table  
  7. melb[Type == "u", .(avg_price = mean(Price)), by="Regionname"

 

 

5個例子比較Python Pandas 和R data.table

 

pandas使用groupby函數(shù)執(zhí)行這些操作。對于data.table,此操作相對簡單一些,因?yàn)槲覀冎恍枰褂胋y參數(shù)即可。

示例4

讓我們進(jìn)一步討論前面的例子。我們求出了房屋的平均價(jià)格,但不知道每個地區(qū)的房屋數(shù)量。

這兩個庫都允許在一個操作中應(yīng)用多個聚合。我們還可以按升序或降序?qū)Y(jié)果進(jìn)行排序。

 

  1. # pandas  
  2. melb[melb.Type == "u"].groupby("Regionname").agg(  
  3. avg_price = ("Price""mean"),  
  4. number_of_houses = ("Price""count")  
  5. ).sort_values(by="avg_price", ascending=False)  
  6.  
  7. # data.table  
  8. > melb[  
  9. Type == "u",  
  10. .(avg_price = mean(Price), number_of_houses=.N),  
  11. by="Regionname"  
  12. ][order(-avg_price)] 

 

 

5個例子比較Python Pandas 和R data.table

 

我們使用計(jì)數(shù)函數(shù)來獲得每組房屋的數(shù)量。”。N”可作為data.table中的count函數(shù)。

默認(rèn)情況下,這兩個庫都按升序?qū)Y(jié)果排序。排序規(guī)則在pandas中的ascending參數(shù)控制。 data.table中使用減號獲得降序結(jié)果。

示例5

在最后一個示例中,我們將看到如何更改列名。例如,我們可以更改類型和距離列的名稱。

類型:HouseType

距離:DistanceCBD

數(shù)據(jù)集中的distance列表示到中央商務(wù)區(qū)(CBD)的距離,因此最好在列名中提供該信息。

 

  1. # pandas  
  2. melb.rename(columns={"Type""HouseType",  
  3. "Distance""DistanceCBD"},  
  4. inplace=True)  
  5.  
  6. # data.table  
  7. setnames(melb,  
  8. c("Type""Distance"),  
  9. c("HouseType""DistanceCBD")) 

 

對于熊貓,我們傳遞了一個字典,該字典將更改映射到rename函數(shù)。 inplace參數(shù)用于將結(jié)果保存在原始數(shù)據(jù)幀中。

對于data.table,我們使用setnames函數(shù)。 它使用三個參數(shù),分別是表名,要更改的列名和新列名。

總結(jié)

我們比較了pandas和data.table在數(shù)據(jù)分析操作過程中常見的5個示例。這兩個庫都提供了簡單有效的方法來完成這些任務(wù)。

在我看來,data.table比pandas簡單一點(diǎn)。

 

需要指出的是,我們在本文中所做的示例只代表了這些庫功能的很小一部分。它們提供了許多函數(shù)和方法來執(zhí)行更復(fù)雜的操作。

 

責(zé)任編輯:華軒 來源: 今日頭條
相關(guān)推薦

2022-10-08 13:29:19

Pandasgroupby

2022-08-14 14:54:10

Pandas字符串數(shù)字類型

2018-01-02 09:44:37

2024-01-25 11:41:00

Python開發(fā)前端

2018-04-02 10:37:10

Linux命令size

2023-04-20 13:59:01

Pythonwhile循環(huán)的

2022-08-01 10:44:37

人工智能AI

2009-10-13 14:33:00

2021-04-20 11:40:47

指針類型CPU

2025-03-28 08:30:00

PythonPandasaxis

2018-01-15 14:07:16

Linux命令free

2023-03-14 08:02:14

靜態(tài)路由動態(tài)路由設(shè)備

2020-08-14 10:57:49

開發(fā)技能代碼

2020-07-26 00:29:54

物聯(lián)網(wǎng)智慧城市IOT

2018-03-12 15:26:00

Linux命令tee

2018-05-05 07:18:52

機(jī)器學(xué)習(xí)線性代數(shù)深度學(xué)習(xí)

2025-05-28 02:00:00

AI智能體文本

2009-06-11 14:48:48

jbpm工作流引擎jbpm例子

2024-10-28 17:06:50

2022-02-25 17:02:38

自動化工作轉(zhuǎn)型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 91视频电影| 成人影院免费视频 | 国产一级一级 | 国产精品欧美一区二区三区不卡 | 青青久草 | 久久久999免费视频 999久久久久久久久6666 | 午夜av电影院| 亚洲精品视频一区二区三区 | 日韩一区二区不卡 | 日韩中文字幕一区二区 | 91视频官网 | 99精品网站 | 99久久免费精品国产免费高清 | 久久国产一区 | 久久国产精品视频 | 国产在线精品一区二区 | 亚洲精品亚洲人成人网 | 国产激情在线看 | 一二三四在线视频观看社区 | 日日碰狠狠躁久久躁婷婷 | 欧美视频成人 | 日韩精品一区二区三区在线播放 | 天堂在线中文字幕 | 久久久91精品国产一区二区三区 | 日韩美av | 精品在线看 | 九九热精品在线 | 拍真实国产伦偷精品 | 91麻豆精品国产91久久久久久 | 亚洲精品久久久一区二区三区 | 日韩欧美在线免费观看视频 | 色婷婷久久 | 奇米影视首页 | 夜夜草av| 国产1区 | 久久精品视频一区二区 | 日韩欧美国产精品一区二区三区 | 国内精品视频在线 | 日本不卡一区二区三区在线观看 | 99久久免费精品 | 久久久999国产精品 中文字幕在线精品 |