成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<s id="uzihh"></s>

<strike id="uzihh"></strike>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

四個(gè)解決特定的任務(wù)的Pandas高效代碼

作者：Python 2023-12-04 13:21:00

開發(fā) 前端

在本文中，我將分享4個(gè)在一行代碼中完成的Pandas操作。這些操作可以有效地解決特定的任務(wù)，并以一種好的方式給出結(jié)果。

在本文中，我將分享4個(gè)在一行代碼中完成的Pandas操作。這些操作可以有效地解決特定的任務(wù)，并以一種好的方式給出結(jié)果。

從列表中創(chuàng)建字典

我有一份商品清單，我想看看它們的分布情況。更具體地說(shuō)：希望得到唯一值以及它們?cè)诹斜碇谐霈F(xiàn)的次數(shù)。

Python字典是以這種格式存儲(chǔ)數(shù)據(jù)的好方法。鍵將是字典，值是出現(xiàn)的次數(shù)。

這里可以使用value_counts和to_dict函數(shù)，這項(xiàng)任務(wù)可以在一行代碼中完成。

這里有一個(gè)簡(jiǎn)單的例子來(lái)說(shuō)明這種情況:

import pandas as pd
 
 grades = ["A", "A", "B", "B", "A", "C", "A", "B", "C", "A"]
 
 pd.Series(grades).value_counts().to_dict()
 
 # output
 {'A': 5, 'B': 3, 'C': 2}

將列表轉(zhuǎn)換為Pandas Series，這是Pandas的一維數(shù)據(jù)結(jié)構(gòu)，然后應(yīng)用value_counts函數(shù)來(lái)獲得在Series中出現(xiàn)頻率的唯一值，最后將輸出轉(zhuǎn)換為字典。這個(gè)操作非常高效且易于理解。

從JSON文件創(chuàng)建DataFrame

JSON是一種常用的存儲(chǔ)和傳遞數(shù)據(jù)的文件格式。

當(dāng)我們清理、處理或分析數(shù)據(jù)時(shí)，我們通常更喜歡使用表格格式(或類似表格的數(shù)據(jù))。由于json_normalize函數(shù)，我們可以通過(guò)一個(gè)操作從json格式的對(duì)象創(chuàng)建Pandas DataFrame。

假設(shè)數(shù)據(jù)存儲(chǔ)在一個(gè)名為data的JSON文件中。一般情況我們都是這樣讀取:

import json
 
 with open("data.json") as f:
     data = json.load(f)
 
 data
 # output
 {'data': [{'id': 101,
    'category': {'level_1': 'code design', 'level_2': 'method design'},
    'priority': 9},
  {'id': 102,
    'category': {'level_1': 'error handling', 'level_2': 'exception logging'},
    'priority': 8}]}

如果我們將這個(gè)變量傳遞給DataFrame構(gòu)造函數(shù)，它將創(chuàng)建如下的DataFrame，這絕對(duì)不是一個(gè)可用的格式:

df = pd.DataFrame(data)

但是如果我們使用json_normalize函數(shù)將得到一個(gè)整潔的DataFrame格式:

df = pd.json_normalize(data, "data")

Explode函數(shù)

如果有一個(gè)與特定記錄匹配的項(xiàng)列表。需要重新格式化它，為該列表中的每個(gè)項(xiàng)目提供單獨(dú)的行。

這是一個(gè)經(jīng)典的行分割成列的問(wèn)題。有許多的不同的方法來(lái)解決這個(gè)任務(wù)。其中最簡(jiǎn)單的一個(gè)(可能是最簡(jiǎn)單的)是Explode函數(shù)。

我們以這個(gè)df為例

使用explosion函數(shù)并指定列名:

df_new = df.explode(column="data").reset_index(drop=True)

reset_index會(huì)為DataFrame分配一個(gè)新的整數(shù)索引。

combine_first函數(shù)

combine_first函數(shù)用于合并兩個(gè)具有相同索引的數(shù)據(jù)結(jié)構(gòu)。

它最主要的用途是用一個(gè)對(duì)象的非缺失值填充另一個(gè)對(duì)象的缺失值。這個(gè)函數(shù)通常在處理缺失數(shù)據(jù)時(shí)很有用。在這方面，它的作用與SQL中的COALESCE函數(shù)相同。

df = pd.DataFrame(
    {
         "A": [None, 0, 12, 5, None], 
         "B": [3, 4, 1, None, 11]
    }
 )

我們需要a列中的數(shù)據(jù)。如果有一行缺少值(即NaN)，用B列中同一行的值填充它。

df["A"].combine_first(df["B"])
 
 # output
 0     3.0
 1     0.0
 2    12.0
 3     5.0
 4    11.0
 Name: A, dtype: float64

可以看到的列A的第一行和最后一行取自列B。

如果我們想要使用3列，我們可以鏈接combine_first函數(shù)。下面的代碼行首先檢查列a。如果有一個(gè)缺失的值，它從列B中獲取它。如果列B中對(duì)應(yīng)的行也是NaN，那么它從列C中獲取值。

df["A"].combine_first(df["B"]).combine_first(df["C"])

我們還可以在DataFrame級(jí)別使用combine_first函數(shù)。在這種情況下，所有缺失的值都從第二個(gè)DataFrame的相應(yīng)值(即同一行，同列)中填充。

df1 = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8]}, index=['a', 'b', 'c', 'd'])
 df2 = pd.DataFrame({'A': [10, np.nan, 30, 40], 'B': [50, 60, np.nan, 80]}, index=['a', 'b', 'c', 'd'])
 result_df = df1.combine_first(df2)

在合并的過(guò)程中，df1 中的非缺失值填充了 df2 中對(duì)應(yīng)位置的缺失值。這有助于處理兩個(gè)數(shù)據(jù)集合并時(shí)的缺失值情況。

Merged DataFrame:
       A     B
 a   1.0   5.0
 b   2.0  60.0
 c  30.0   7.0
 d   4.0   8.0

總結(jié)

從計(jì)算簡(jiǎn)單的統(tǒng)計(jì)數(shù)據(jù)到高度復(fù)雜的數(shù)據(jù)清理過(guò)程，Pandas都可以快速解決任務(wù)。上面的代碼可能不會(huì)經(jīng)常使用，但是當(dāng)你需要處理這種任務(wù)時(shí)，它們是非常好的解決辦法。

責(zé)任編輯：華軒來(lái)源： DeepHub IMBA

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板：亚洲逼院| 久久亚洲天堂 | 国产精品99久久久久久人 | 一区二区日韩 | 免费黄色a视频 | 欧美一级二级三级 | 九九av| 一区二区三区视频免费观看 | av日韩在线播放 | 亚洲视频免费一区 | 国产福利91精品一区二区三区 | 欧美精品久久久 | 影音先锋中文字幕在线观看 | 狠狠涩| 日韩在线 | 亚洲交性| 亚洲va欧美va人人爽午夜 | 黑人巨大精品欧美一区二区免费 | 一区二区三区中文字幕 | 亚洲a视 | 三级av在线 | 亚洲另类视频 | 亚洲人人 | 日韩一区在线观看视频 | 中文字幕三区 | 久久精品视频99 | 色综合色综合色综合 | 欧美99 | 中文字幕一区在线 | 国产91久久精品一区二区 | 国产精品久久久久久久久久免费看 | 久久av一区二区三区 | 免费一级网站 | 宅女噜噜66国产精品观看免费 | 欧美激情第一区 | 欧美精品在线看 | 久草新在线 | 国产一区二区在线看 | 天天射网站 | 亚洲欧美国产视频 | 国产精品国产三级国产aⅴ无密码 |

<input id="jgrxv"></input>

<label id="jgrxv"></label>

<noscript id="jgrxv"></noscript>