成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Python數據分析實戰,小費數據集應用

開發 后端 大數據
本節選用的是Python的第三方庫seaborn自帶的數據集,該小費數據集為餐飲行業收集的數據,其中total_bill為消費總金額、tip為小費金額、sex為顧客性別、smoker為顧客是否吸煙、day為消費的星期、time為聚餐的時間段、size為聚餐人數。

一、數據來源

本節選用的是Python的第三方庫seaborn自帶的數據集,該小費數據集為餐飲行業收集的數據,其中total_bill為消費總金額、tip為小費金額、sex為顧客性別、smoker為顧客是否吸煙、day為消費的星期、time為聚餐的時間段、size為聚餐人數。

  1. import numpy as np 
  2. from pandas import Series,DataFrame 
  3. import pandas as pd 
  4. import seaborn as sns    #導入seaborn庫 
  5. tips=sns.load_dataset('tips')  #seaborn庫自帶的數據集 
  6. tips.head() 

 

Python數據分析實戰,小費數據集應用

二、問題探索

  • 小費金額與消費總金額是否存在相關性?
  • 性別、是否吸煙、星期幾、聚餐人數和小費金額是否有一定的關聯?
  • 小費金額占小費總金額的百分比是否服從正態分布?

三、數據清洗

  1. tips.shape #數據集的維度 

(244,7)

共有244條數據,7列。

  1. tips.describe() #描述統計 

 

Python數據分析實戰,小費數據集應用

描述統計結果如上所示。

  1. tips.info() #查看缺失值信息 

 

Python數據分析實戰,小費數據集應用

此例無缺失值。

四、數據探索

  1. tips.plot(kind='scatter',x='total_bill',y='tip') #繪制散點圖 

 

Python數據分析實戰,小費數據集應用

由圖可看出,小費金額與消費總金額存在正相關性。

  1. import numpy as np 
  2. from pandas import Series,DataFrame 
  3. import pandas as pd 
  4. import seaborn as sns   #導入seaborn庫 
  5. tips=sns.load_dataset('tips')#seaborn庫自帶的數據集 
  6. tips.head() 

3.0896178343949052

  1. female_tip = tips[tips['sex'] == 'Female']['tip'].mean() #女性平均消費金額female_tip 

2.833448275862069

  1. s = Series([male_tip,female_tip],index=['male','female']) 

male 3.089618

female 2.833448

dtype: float64

  1. s.plot(kind='bar') #男女平均小費柱狀圖 

 

Python數據分析實戰,小費數據集應用

由圖可看出,女性小費金額小于男性小費金額。

 

  1. sun_tip = tips[tips['day'] == 'Sun']['tip'].mean() 
  2. sat_tip = tips[tips['day'] == 'Sat']['tip'].mean() 
  3. thur_tip = tips[tips['day'] == 'Thur']['tip'].mean() 
  4. fri_tip = tips[tips['day'] == 'Fri']['tip'].mean()#各個日期的平均小費值 
  5. s = Series([thur_tip,fri_tip,sat_tip,sun_tip],index=['Thur','Fri','Sat','Sun']) 

 

Python數據分析實戰,小費數據集應用

 

  1. s.plot(kind='bar') #日期平均小費柱狀圖 

 

Python數據分析實戰,小費數據集應用

由圖可看出,周六、周日的小費比周四、周五的小費高。

  1. tips['percent_tip'] = tips['tip']/(tips['total_bill']+tips['tip']) 
  2. tips.head(10) #小費所占百分比 

 

Python數據分析實戰,小費數據集應用

 

  1. tips['percent_tip'].hist(bins=50)#小費百分比直方圖 

 

Python數據分析實戰,小費數據集應用

由圖可看出,小費金額占小費總金額的百分比基本服從正態分布。

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2020-02-20 10:45:51

Python數據疾病

2023-11-24 14:02:00

Python數據分析

2024-07-01 13:51:14

2017-09-18 17:59:23

Hadoop數據分析

2020-05-14 10:19:23

Python可視化分析

2019-08-01 13:09:57

大數據分析建模信息化

2023-05-15 12:41:26

2024-06-06 09:08:14

NumPyPython數據分析

2015-08-14 10:28:09

大數據

2022-02-06 11:35:53

SQL數據函數

2022-11-11 11:35:14

2019-04-15 13:40:47

大數據分析建模數據數據分析

2021-03-15 10:43:20

大數據數據分析工具

2020-05-13 11:32:28

數據分析數值分析

2017-02-16 10:00:26

python數據加載

2022-11-14 10:36:55

數據科學數據分析

2023-11-24 08:47:36

ScipyPython

2019-05-15 15:57:15

Python數據分析爬蟲

2020-07-14 16:08:33

數據分析Python筆試

2021-12-24 08:18:01

CIO數據分析
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩av成人在线 | 亚洲精品av在线 | 日本精品一区二区三区在线观看视频 | 欧美在线视频网站 | 91一区二区三区在线观看 | www.国产.com| 亚洲国产成人精品女人久久久野战 | 欧美日韩视频在线播放 | 欧美成人久久 | 自拍第一页 | 久久99精品久久久久久琪琪 | 成人影院av | 国产精品成人久久久久 | 亚洲欧美视频一区二区 | 久久精品| 黄在线免费观看 | 97人人干 | 中文在线视频 | 久久99视频| 91xh98hx 在线 国产 | 91av免费版| 偷拍自拍网址 | 黄色大片在线播放 | 一二三四av| 成人精品一区二区户外勾搭野战 | 欧美成视频 | 日本网站免费观看 | 久久久精品网站 | 在线观看国产视频 | 毛片一区二区三区 | 国产精品美女久久久久aⅴ国产馆 | 国产一区二区三区在线免费观看 | 午夜精品久久 | 亚洲视频欧美视频 | 91精品观看 | 91激情视频 | 中文字幕啪啪 | 久草在线| 日韩av在线播 | 国产91av视频在线观看 | 国产美女在线精品免费 |