成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<rt id="ksq8s"><delect id="ksq8s"></delect></rt>

<abbr id="ksq8s"></abbr>

<dl id="ksq8s"></dl>

<rt id="ksq8s"></rt>

<button id="ksq8s"></button>

<code id="ksq8s"><wbr id="ksq8s"></wbr></code>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

Pandas 數據分析：五大核心操作助你高效挖掘數據價值

作者：用戶007 2025-06-06 08:35:41

大數據數據分析

作為數據分析師日常工作的核心支撐工具，Pandas能輕松處理大規模結構化數據，執行復雜轉換和聚合操作。本文將深入剖析Pandas數據分析中應用頻率最高的五個核心操作。

Python的Pandas庫已成為數據分析領域的標準工具，其強大的DataFrame結構讓數據處理變得前所未有的高效。作為數據分析師日常工作的核心支撐工具，Pandas能輕松處理大規模結構化數據，執行復雜轉換和聚合操作。

本文將深入剖析Pandas數據分析中應用頻率最高的五個核心操作。

1. 數據載入與探查：read_csv與基礎探查

(1) 數據獲取起點

import pandas as pd

# 從CSV文件加載數據
df = pd.read_csv('sales_data.csv', parse_dates=['order_date'])

# 基礎數據探查三步法
print("數據結構概覽：")
print(df.info())

print("\n數據統計摘要：")
print(df.describe(include='all'))

print("\n首尾數據樣本：")
display(df.head(3), df.tail(2))

(2) 關鍵作用解析

read_csv:多參數控制日期解析、缺失值標記、編碼格式
info():內存優化關鍵（顯示列數據類型+內存占用）
describe():自動統計數值列的分布（均值、分位數等）
head()/tail():快速驗證數據加載正確性

?? 實戰技巧：添加memory_usage='deep'參數可精確計算內存占用，處理大表必備

2. 數據清洗與預處理：處理缺失值與重復項

(1) 數據質量決定分析上限

# 缺失值分析
missing_matrix = df.isnull().sum()
print("缺失值統計：\n", missing_matrix[missing_matrix > 0])

# 智能填充策略
df['product_category'].fillna('Unknown', inplace=True)  # 分類變量填充
df['unit_price'] = df.groupby('region')['unit_price'].transform(
    lambda x: x.fillna(x.median()))  # 分組填充中位數

# 處理重復記錄
duplicates = df.duplicated(subset=['order_id'], keep=False)
print(f"發現{duplicates.sum()}條疑似重復訂單")
df.drop_duplicates(subset=['order_id'], keep='first', inplace=True)

(2) 關鍵作用解析

isnull():布爾定位缺失值位置
fillna():差異化填充策略（常量、統計值、插值）
duplicated():精準識別重復記錄
drop_duplicates():定制化刪除（保留首次/末次出現）

?? 典型錯誤：直接dropna()可能丟失有價值數據，需結合業務判斷

3. 數據切片與篩選：loc/iloc與布爾索引

(1) 精確數據獲取技術

# 列選擇技巧
essential_cols = df.loc[:, ['order_date', 'customer_id', 'total_amount']]

# 復雜條件篩選
q3_high_value = df.loc[
    (df['order_date'].dt.quarter == 3) & 
    (df['total_amount'] > 1000) &
    (df['payment_status'] == 'completed')
]

# 混合索引演示
sample_data = df.iloc[10:20, [2, 5, 7]]  # 行號+列位置索引

(2) loc與iloc核心區別

特性	loc	iloc
索引類型	標簽索引(含列名)	純整數位置索引
切片包含	包含結束位置	不包含結束位置
布爾索引	完美支持	需轉換布爾數組

?? 進階技巧：使用query()方法實現類SQL表達式過濾：df.query("total_amount > 500 and region in ['East','West']")

4. 數據變形與重組：groupby聚合與pivot_table

(1) 維度分析黃金組合

# 基礎分組統計
region_sales = df.groupby('region')['total_amount'].agg(
    total_sales='sum',
    avg_order='mean',
    order_count='count'
).reset_index()

# 多維透視分析
pivot = pd.pivot_table(df,
                       index='product_category',
                       columns=df.order_date.dt.month,
                       values='quantity',
                       aggfunc='sum',
                       fill_value=0,
                       margins=True)

(2) 核心參數解析

agg():多函數聚合（可自定義聚合邏輯）

pivot_table參數：

index/columns：行列維度
values：聚合指標
aggfunc：聚合方式（sum/mean等）
margins：添加總計行/列

5. 時間序列處理：重采樣與滑動窗口

(1) 時間維度深度分析

# 日期維度轉換
df['year_month'] = df['order_date'].dt.to_period('M')

# 月度重采樣分析（時間序列）
monthly_sales = df.set_index('order_date').resample('M')['total_amount'].sum()

# 滑動窗口分析（趨勢觀察）
rolling_avg = monthly_sales.rolling(window=3, min_periods=1).mean()

(2) 關鍵方法對比

方法	應用場景	典型函數
resample	頻率轉換（天→周/月）	sum/mean/max等
rolling	移動窗口計算（滾動平均/求和）	mean/sum/std
expanding	累積計算（YTD累計）	cumsum/cumprod

結語：從操作到洞見的躍遷

通過掌握這五大Pandas核心操作，您已完成數據分析工作流的閉環建設。但需謹記：技術僅是工具，真正的價值在于如何通過數據解決業務問題：

80/20法則：工作中80%的數據需求可通過這5類操作實現
組合創新：多操作集成解決復雜需求（如分組后清洗）
性能優化：大數據集時關注向量化操作，避免原生循環

責任編輯：趙寧寧來源： Python數智工坊

Pandas 數據分析 Python

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：日本h片在线观看 | 日韩免费视频一区二区 | 免费久| 国产在线一区二区 | 亚洲小视频 | 秋霞电影一区二区三区 | 日本欧美三级高清视频 | 国产精品日韩一区二区 | 国产精品一区二区在线播放 | 黄色精品 | 可以免费观看的av | 国产精品免费观看视频 | 精品国产欧美一区二区 | 中文字幕a√| 久久9热| 你懂的av| 亚洲精品国产电影 | 欧美日韩国产一区二区三区 | 羞羞网站在线免费观看 | 国产精品久久久亚洲 | 日韩另类视频 | 99热视 | 日韩视频在线一区 | 欧美一区二区三区在线看 | 夜夜夜久久久 | 亚洲精品久久久久久久久久久久久 | 欧美日韩一区二区在线播放 | 亚洲国产精品久久久久 | 超碰在线播 | 北条麻妃视频在线观看 | 日韩视频中文字幕 | 国产99精品 | 黑人精品欧美一区二区蜜桃 | 日韩福利一区 | 偷拍第一页| 亚洲精品区 | 天天操天天操 | 亚洲啪啪一区 | 国产日韩欧美一区二区 | 亚洲伊人精品酒店 | 99久久中文字幕三级久久日本 |

<rt id="om0m0"></rt>

<code id="om0m0"><wbr id="om0m0"></wbr></code>

<dl id="om0m0"><acronym id="om0m0"></acronym></dl>

<samp id="om0m0"><em id="om0m0"></em></samp>