手把手教你用Python實現Excel中的Vlookup功能
一、前言
大家好,我是崔艷飛。工作中經常會遇到,需要把兩張Excel或Csv數據表通過關鍵字段進行關聯,匹配對應數據的情況,Excel雖有Vlookup函數可以處理,但數據量大時容易計算機無響應,可能出現數據丟失,處理速度較慢是軟肋,而Python只需幾行代碼就能輕松實現,且處理速度快,詳細如下。
二、項目目標
用Python實現兩張Excel或Csv表數據關聯處理。
三、項目準備
軟件:PyCharm
需要的庫:pandas
四、項目分析
1)如何讀取要處理的Csv文件?
利用pandas庫讀取Csv文件。
2)如何讀取要處理的Excel文件?
利用pandas庫讀取Excel文件。
3)如何通過關鍵字段關聯匹配兩張表中的數據?
利用merge()函數,通過關鍵字段,關聯組合兩張表中的數據。
4)如何保存結果?
利用to_csvl保存關聯組合后的數據。
五、項目實現
1、第一步導入需要的庫
- import pandas as pd
2、第二步讀取要處理的Csv文件
- # 讀入表1
- df1 = pd.read_csv('D:/a/1.csv', encoding='gbk')
3、第三步讀取要處理的Excel文件
- # 讀入表2
- df2 = pd.read_excel('D:/a/2.xlsx', encoding='utf-8')
4、第四步關聯匹配數據,并保存結果文件
- # 關聯數據
- data = df1.merge(df2, on='姓名',left_index=False, right_index=False, sort=False)
- # 保存數據
- data.to_csv('D:/a/result.csv', encoding='gbk',index=False)
六、效果展示
1、處理前表1數據:
2、處理前表2數據:
3、處理后的關聯匹配數據:
七、總結
本文介紹了如何利用Python進行Excel和Csv間的數據關聯處理,替代了Excel的Vlookup函數,由于不用顯示源文件,節省了系統資源,處理效率更高,數據量越大,優勢越明顯,Python還有很多類似的函數,數據處理,唯快不破,有興趣的同學可以研究下。
最后需要本文項目代碼的小伙伴,請在公眾號后臺回復“Vlookup”關鍵字進行獲取,如果在運行過程中有遇到任何問題,請隨時留言或者加小編好友,小編看到會幫助大家解決bug噢!