成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

SQL和Python的集合操作對比:適合的就好!

運維 數據庫運維
對于分析師或數據科學家而言,熟悉多種分析編程語言可以在當今數據環境中贏得優勢。在多語言法的主流對話中,尤其是SQL語言和Python語言,通常被描述為功能性離散。

[[267199]]

 對于分析師或數據科學家而言,熟悉多種分析編程語言可以在當今數據環境中贏得優勢。在多語言法的主流對話中,尤其是SQL語言和Python語言,通常被描述為功能性離散。

SQL和Python都可以實現許多功能。探索兩種編程語言重疊的功能可以幫助只熟悉一種編程語言的人更加熟悉另一種編程語言。組合和利用每種編程語言,可以對其做出更明智的決策,并更好地為每個任務選擇合適的工具。了解如何在SQL或Python中完成任務將幫助你選擇出***的工作工具。

集合操作

分析式問題通常需要檢查多個不同的數據集。在解答過程中,通過比較或組合不同的數據集來創建一組新數據集,非常有效。

例如,你可能有兩個單獨的表,其中包含要轉換為單個事務表的事務性數據,你想把它們合并為一個表,或者創建一個同時包含兩個表中數據的新事務表。

在SQL中,集合操作符可以解決這個問題。集合操作符支持對比性操作,可以有條件地連結兩個SQL語句的結果集。SQL集合操作符包括:

  • UNION:從待比較的兩個查詢語句返回結果行。在默認情況下,如果兩個SQL語句的結果集中存在相同的行,則UNION不會返回重復行。如果你想返回重復行,可以向集合操作符UNION提供可選ALL關鍵字。
  • INTERSECT:返回位于兩個待比較的查詢語句結果集中的行。
  • EXCEPT(或者MINUS):返回到非待比較的查詢語句結果集中的行。

雖然Python中沒有特定的集合操作符種類,但Python中仍然有各種各樣的函數可以實現這些功能。

為了說明如何在實踐中使用這些集合操作,先假設你作為一名雙邊市場數據科學家。在你的市場中有買家和賣家,二者并不相互排斥?,F在,買賣雙方分別存在于buyers和sellers表格的數據庫中。讓我們來瀏覽一下集合操作可能發揮作用的幾種場景。

合并和合并所有

假設你想把存在于buyers和sellers表格中的所有用戶合并到一個新的單獨的“用戶”表格中。

在SQL中,你可以使用UNION操作符和可選ALL關鍵字來實現:

  1. -- SQL
  2. select user_id  
  3. from modeanalytics.buyers  
  4. union all  
  5. select user_id  
  6. from modeanalytics.sellers 

在Python中,可以使用pandas .concat()函數復制上面執行的UNION ALL集合操作。

pandas .concat()方法沿著選定的軸連接pandas對象(例如Dataframes,Series等)。假設您已將buyers和sellers數據庫表格中user_id字段存儲在兩個pandas數據框對象中(buyers 和 sellers),你可以使用以下Python代碼復制上面執行過的UNION ALL集合操作:

  1. # Python 
  2. users = pd.concat([buyers, sellers]) 

需要注意的是,在SQL中使用UNION和ALL關鍵字,或者在Python中使用pandas concat()方法,你將把存在于兩個表格中的用戶(用戶即是買家又是賣家)返回到重復行。但是,如果你只想返回存在于兩個表中的一個用戶的單一實例時:

在SQL中,從UNION集合操作符中移除ALL關鍵字:

  1. -- SQL
  2. select user_id  
  3. from modeanalytics.buyers  
  4. union  
  5. select user_id  
  6. from modeanalytics.sellers 

在Python中,將.drop_duplicates()方法鏈接在連接pandas對象上:

  1. # Python 
  2. users = pd.concat([buyers, sellers]).drop_duplicates() 

交集

反之,如果你想創建一個既是買家又是賣家的獨立用戶表格呢?

在SQL中,你可以使用INTERSECT集合操作符:

  1. -- SQL
  2. select user_id  
  3. from modeanalytics.buyers  
  4. intersect  
  5. select user_id  
  6. from modeanalytics.sellers 

在Python中,你可以在數據框中使用pandas .merge()方法:

  1. Python 
  2. buyers_and_sellers = buyers.merge(sellers) 

默認情況下,pandas .merge()方法將嘗試將兩個數據框中的所有列進行“內部”合并。此默認操作基本復制了SQL集合操作符INTERSECT的步驟。

差集

現在,如果你想返回到所有買家用戶,而不是賣家用戶。

在SQL中,你可以使用EXCEPT集合操作:

  1. -- SQL 
  2. select user_id 
  3. from modeanalytics.buyers 
  4. except 
  5. select user_id 
  6. from modeanalytics.sellers 

值得注意的是,SQL的EXCEPT集合操作符只能返回到***個表格,不能返回到第二個表格。如果你想要返回到賣方的表格中,你需要顛倒SELECT語句的順序:

  1. -- SQL 
  2. select user_id 
  3. from modeanalytics.sellers 
  4. except 
  5. select user_id 
  6. from modeanalytics.buyers 

在Python中,利用pandas布爾索引技術和pandas .isin() 索引來復制SQL EXCEPT集合操作符的功能:

  1. # Python  
  2. buyers_not_sellers = buyers[buyers.user_id.isin(sellers.user_id) == False 
  3. sellers_not_buyers = sellers[sellers.user_id.isin(buyers.user_id) == False]` 

模糊界限

到這里,你已經了解了如何在Python中復制大量SQL集合操作符的功能。最終,編程模式的選擇取決于你,甚至可以在項目基礎上逐個改動。只有通過掌握分析語言功能上的重疊,才能有效做出決策。這就是使用多種數據分析語言的好處:你可以自定義一個混合方法來滿足你不斷發展的需求。

責任編輯:武曉燕 來源: 今日頭條
相關推薦

2021-04-09 23:00:12

SQL數據庫Pandas

2022-07-20 12:24:38

Python列表集合

2011-08-25 14:10:00

SQL ServerDB2修改數據表列

2020-10-16 11:53:52

數據分析PythonSQL

2011-03-03 09:43:53

Visual Stud

2024-11-11 07:00:00

Python編程

2024-09-12 17:05:13

2014-06-19 10:48:18

RubyPython

2024-04-18 09:16:03

EnumeratePythonFor循環

2020-07-03 18:14:20

JavaScript開發技術

2017-11-14 18:54:43

MySQLMongoDBNoSQL

2010-10-09 10:39:49

2017-03-14 14:38:21

數據庫SQL語句集合運算

2023-10-11 11:24:08

SQL和PythonPython

2011-03-23 17:11:21

Lampwamp

2025-01-03 17:10:54

2013-03-15 15:04:41

vSphere備份VDP

2021-08-19 10:30:13

Java集合排序程序開發

2020-11-26 10:04:04

Java 編程開發

2013-08-20 13:22:35

PythonGo編程語言
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久草资源网站 | 久久久久久国产精品 | 国产视频精品在线观看 | 伊人网站在线 | 日韩不卡一区二区 | 久久极品| 成人欧美一区二区三区黑人孕妇 | 国产综合精品一区二区三区 | 国产精品永久久久久 | 久久久久久久国产 | 成年免费大片黄在线观看岛国 | av网站在线播放 | 日韩欧美一区二区三区在线播放 | 91精品国产综合久久久亚洲 | 国产精品精品3d动漫 | 亚洲精品乱码久久久久久按摩观 | 毛片一区二区三区 | 青青久久久 | av天天操 | 亚洲图片一区二区三区 | 9999久久 | 亚洲国产一区二区在线 | 国产中的精品av涩差av | 日韩免费毛片视频 | 涩涩视频在线看 | 亚洲精品久久久久久久久久久 | 欧美日韩不卡合集视频 | 亚洲狠狠爱一区二区三区 | 欧美日韩在线观看一区 | 久久久国产一区二区三区四区小说 | 亚洲精品久 | 亚洲免费一区 | 97起碰| 婷婷丁香激情 | 国产亚韩| 能看的av网站 | 一区二区中文 | 国产美女视频一区 | 欧美成人a| 波多野结衣精品 | 精品久久久久久中文字幕 |