成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何在Python中加入多個數據幀?

開發 后端
你正在處理一個從多個源收集數據的項目。在進入探索和模型構建部分之前,你需要首先連接這些多個數據集(以表、數據幀等形式)。怎么能做到這一點而不丟失任何信息?

初學Python編程的人,面臨的是各種未知的挑戰。

下面是一個幾乎讓所有更有抱負的數據科學家都感到意外的場景:

你正在處理一個從多個源收集數據的項目。在進入探索和模型構建部分之前,你需要首先連接這些多個數據集(以表、數據幀等形式)。怎么能做到這一點而不丟失任何信息?

這聽起來可能是一個簡單的場景,但對于許多新來的人來說,這可能是一個威脅,特別是那些不熟悉Python編程的人。

​如何在Python中加入多個數據幀?

進一步深入研究,我可以大致將其分為兩種情況:

  • 首先,具有相似屬性的數據可以分布到多個文件中。例如,假設向你提供了多個文件,每個文件都存儲一年中某一周內發生的銷售信息。因此,全年將有52個文件。每個文件的列數和名稱都相同。
  • 其次,你可能需要合并來自多個來源的信息。例如,假設你想獲得購買產品的人的聯系信息。這里有兩個文件,第一個有銷售信息,第二個有客戶信息。

理解手頭的問題

本文列舉一個通俗易懂的例子。

想一下在一個特定的學校里考試。每個科目都有不同的老師授課。他們更新關于學生成績和整體表現的檔案。這些檔案就是多個文件!

本文使用創建的兩個這樣的文件來演示Python中函數的工作。第一個文件包含關于12班學生的數據,另一個文件包含10班的數據。還將使用第三個文件來存儲學生的姓名和學生ID。

注意:雖然這些數據集是從零開始創建的,但鼓勵將所學應用于選擇的數據集。

在Python中逐步合并數據幀的過程

下面是解決這個問題的方法:

  • 用Python加載數據集
  • 合并兩個相似的數據幀(append)
  • 合并來自兩個數據幀的信息(merge)

步驟1:用Python加載數據集

本文將使用三個獨立的數據集。首先,將這些文件加載到單獨的數據幀中。

  1. import pandas as pd 
  1. marks10th=pd.read_csv('10thClassMarks.csv') 
  1. marks12th=pd.read_csv('12thClassMarks.csv') 
  1. IDandName=pd.read_csv('StudentIDandName.csv') 

前兩個數據框包含學生的百分比及其學生ID。在第一個數據框中,有10班學生的分數,而第二個數據框包含第12個標準中學生的分數。第三個數據框包含學生的姓名以及各自的學生ID。

[[315918]]

來源:btime

使用“head”函數檢查每個數據幀的前幾行:

  1. marks10th.head() 
  1. marks12th.head() 
  1. IDandName.head() 

​如何在Python中加入多個數據幀?

步驟2:合并兩個相似的數據幀(Append)

把10、12班的檔案合并起來,找出學生的平均分。這里使用Pandas庫中的“append”函數:

  1. allMarks=marks10th.append(marks12th) 
  1. marks10th.shape, marks12th.shape, allMarks.shape 

輸出((50,3),(50,3),(100,3))

從輸出中可以看到,在append函數中垂直添加兩個數據幀。

結果數據幀是allMarks。上面比較了所有三個數據幀的形狀。

接下來看看“allMarks”的內容并計算平均值:

​如何在Python中加入多個數據幀?

  1. allMarks['Exam Points'].mean() #Average Marks 

輸出:49.74

步驟3:合并來自兩個數據幀的信息(Merge)

現在,假設想找出在這兩個批次中排名第一的學生的名字。這里不需要垂直添加數據幀。為了給學生的名字再加一列,我們將不得不水平縮放。

要做到這一點,我們會發現最高得分:

  1. allMarks['Exam Points'].max() # Maximum Marks 

輸出:100

學生的最高成績是100分。現在,使用“merge”函數查找此學生的姓名:

  1. mergedData=allMarks.merge(IDandName, on='student id'
  1. mergedData.head() 

​如何在Python中加入多個數據幀?

最后,生成的數據框有學生的名字和他們的標記。

merge函數需要一個必要的屬性,兩個數據幀將在該屬性上合并。需要傳遞此列的名稱在“on”參數中。

merge函數的另一個重要論點是“如何”。這指定要在數據幀上執行的聯接類型。以下是可以執行的不同連接類型(SQL用戶將非常熟悉這一點):

  • 內部連接(如果不提供任何參數,則默認執行)
  • 外部連接
  • 右連接
  • 左連接

還可以使用“sort”參數對數據幀進行排序。這些是合并兩個數據幀時最常用的參數。

[[315919]]

來源:Pexels

現在,我們將看到數據框包含100個“檢查點”的行:

  1. mergedData.loc[mergedData['Exam Points']==100] 

​如何在Python中加入多個數據幀?

三個學生得了100分,其中兩個在10班。做得好!

接下來,我的建議是接受包含3個不同文件的食物預測挑戰。

很直截了當,對吧?

你再也不必為此而自責了!你可以繼續并將其應用于選擇的任何數據集。

 

責任編輯:趙寧寧 來源: 今日頭條
相關推薦

2013-04-02 15:23:12

2009-11-24 19:33:07

PHP字符串中加入變量

2013-11-13 09:22:16

2011-03-18 09:48:32

2011-03-02 17:41:28

2017-02-08 21:20:24

LinuxUbuntu加密硬盤

2024-01-30 15:29:20

Django數據庫Python

2009-06-29 09:44:07

Smooth StreSilverlight

2024-03-25 00:02:00

Android移動開發視頻

2022-09-26 08:35:53

磁盤Java解密

2025-01-07 12:58:28

2013-03-19 10:17:59

云計算谷歌BigQuery

2020-07-01 16:45:13

matplotlib內嵌圖Python

2020-05-19 13:55:38

Python加密密碼

2011-10-13 16:34:30

MeeGoQt插件

2011-03-24 16:01:30

數據庫管理

2012-11-30 16:02:57

在vSphereiSCSI存儲虛擬化

2009-07-02 09:35:02

hibernate訪問

2015-08-05 09:40:26

2020-05-25 17:40:00

MacpyenvPython
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美a区 | 精品久久久久一区二区国产 | 精品视频免费 | 999久久久久久久久6666 | 欧美激情视频一区二区三区免费 | 亚洲成av人片在线观看无码 | 伊人久久综合 | 精品中文在线 | 国产精品区二区三区日本 | 国产高清视频在线观看 | 久久久久久国产精品 | 99re视频在线观看 | 亚洲欧美日韩系列 | 国产一级片 | 成人在线一区二区三区 | 亚洲国产成人在线 | 日韩久久久久 | 精品久久中文 | 久久成人国产精品 | 久久狠狠 | 精品视频一区在线 | 亚洲精品一区国语对白 | 亚洲97 | 午夜爱爱毛片xxxx视频免费看 | 老司机成人在线 | 中文字幕亚洲精品 | 国产中文字幕在线观看 | 久国产视频| 国产精品美女一区二区 | 91精品在线播放 | a级片在线观看 | 精品国产99 | 精品一区二区久久久久久久网站 | 成人片免费看 | 又黄又爽的网站 | 香蕉二区| 欧美精品久久久久 | 最新91在线 | 欧美日韩电影免费观看 | 日本成年免费网站 | 亚洲成人精品 |