成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<big id="gwkyb"><optgroup id="gwkyb"><xmp id="gwkyb"></xmp></optgroup></big>

<cite id="gwkyb"></cite>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

Python數據分析：大眾點評數據進行選址

作者：松鼠愛吃餅干 2020-04-30 16:38:21

大數據數據分析

本文的文字及圖片來源于網絡,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理。

[[324555]]

前言

本文的文字及圖片來源于網絡,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理。

如果你處于想學Python或者正在學習Python，Python的教程不少了吧，但是是最新的嗎?說不定你學了可能是兩年前人家就學過的內容，在這小編分享一波2020最新的Python教程。

一、項目背景

案例類型：練習
案例工具：Python、Qgis
案例目的：通過實戰進行學習，讓大家綜合運用基礎知識，加深印象鞏固記憶。

二、提出問題

通過餐飲數據分析選出最具有競爭力的品類;
通過建立綜合分數指標的計算公式來挑選出最適合地址。

三、理解數據

讀取數據集后，通過info()和describe()方法來查看一下數據的基本情況。

data.info() 
—————————————————————————— 
<class 'pandas.core.frame.DataFrame'> 
RangeIndex: 96398 entries, 0 to 96397 
Data columns (total 10 columns): 
類別      96258 non-null object 
行政區     96255 non-null object 
點評數     96398 non-null int64 
口味      96398 non-null float64 
環境      96398 non-null float64 
服務      96398 non-null float64 
人均消費    96398 non-null int64 
城市      96398 non-null object 
Lng     96398 non-null float64 
Lat     96398 non-null float64 
dtypes: float64(5), int64(2), object(3) 
memory usage: 7.4+ MB 
數據共計96398個，10個變量/特征，數據類型數量為 float64(5), int64(2), object(3)，粗略觀察，數據明顯有缺失值的情況，需要進行數據的清洗。

四、數據處理

使用data.isnull().values.sum()檢查空值數量，檢查出283個空值。

由于空值占數據總量比例為283/96398 = 0.0029，刪除空值并不影響整體的數據情況，所以這里采用刪除的辦法來處理空值。

使用data.dropna()對空值進行刪除，再使用data.isnull().values.sum()進行檢查，結果為0。

數據清洗后的數據共計96255個。根據①通過餐飲數據分析選出最具有競爭力的品類的要求，選擇相關的變量，選擇['類別', '口味', '環境', '服務', '人均消費’]5個變量。

建立['類別', '口味', '環境', '服務', '人均消費’]的DataFrame，并且篩選出所有評分和消費大于0的情況。因為根據實際情況，評分和消費為0的數據對此沒有參考作用。

Python數據分析：大眾點評數據進行選址

引入’性價比’這一列，性價比的計算方式將所有的評分相加再除以人均消費金額，計算出分/元為單位的數值，表示單位價格獲得的分數來表示其性價比。

Python數據分析：大眾點評數據進行選址

這樣獲得了df如下，篩選出了需要的數據54886個。

df.info() 
—————————————————————————— 
<class 'pandas.core.frame.DataFrame'> 
Int64Index: 54886 entries, 0 to 96395 
Data columns (total 6 columns): 
類別      54886 non-null object 
口味      54886 non-null float64 
環境      54886 non-null float64 
服務      54886 non-null float64 
人均消費    54886 non-null int64 
性價比     54886 non-null float64 
dtypes: float64(4), int64(1), object(1) 
memory usage: 2.9+ MB

五、構建模型

得到數據集df，選擇'類別'進行groupby分組再進行mean值等到每個類別的值。

Python數據分析：大眾點評數據進行選址

使用箱型圖進行異常值的排查。

Python數據分析：大眾點評數據進行選址

Python數據分析：大眾點評數據進行選址

箱型圖使用異常值刪除的函數，對異常值進行刪除。

Python數據分析：大眾點評數據進行選址

構建一個選擇具有競爭力的品類的公式的因素，例如’口味'，'人均消費’，'性價比’，然后通過異常值刪除的函數得出數據集。

Python數據分析：大眾點評數據進行選址

將三組數據集放在同一張圖上面。

Python數據分析：大眾點評數據進行選址

Python數據分析：大眾點評數據進行選址

很明顯是由于沒有做數據標準化處理。

數據標準化處理之后

Python數據分析：大眾點評數據進行選址

Python數據分析：大眾點評數據進行選址

設計了一個計算公式，權重自己設計分數的計算式比如按照口味:人均消費:性價比 = 2:5:3 的比例去計算。

先合并df_kw_max_min、df_rj_max_min、df_xjb_max_min，通過pd.merge合并。

Python數據分析：大眾點評數據進行選址

計算最后的得分

Python數據分析：大眾點評數據進行選址

得出【甜品】是最佳的品類。

使用Qgis制作出關于'人口密度'、'道路密度'、'餐飲密度'、'競品密度’、'經度’、’維度'相關的數據集。

Python數據分析：大眾點評數據進行選址

數據集有空值，使用dealdata.fillna(0,inplace=True)進行0的填充。

觀察數據得知，'人口密度'、'道路密度'、'餐飲密度'、'競品密度’不在同一緯度上，所以進行數據標準化處理。再計算['綜合指標’]這一新列的數值。按照’人口密度’:'道路密度’:'餐飲密度’:'競品密度’=4:3:2:1的比例。

六、數據可視化

利用matplotlib進行制圖，使用散點圖。

Python數據分析：大眾點評數據進行選址

Python數據分析：大眾點評數據進行選址

補充：使用bokeh繪制空間互動圖形。

Python數據分析：大眾點評數據進行選址

Python數據分析：大眾點評數據進行選址

得出結論：

甜品店選址在(121°472′E,31°301′N)、(121°473′E,31°274′N)、(121°493′E,31°244′N)等地方開設最優

責任編輯：未麗燕來源：今日頭條

數據分析可視化代碼

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：黄一级| 91精品国产91久久久久久最新 | 欧美综合久久久 | 精品久久99| 一级做a爰片性色毛片视频停止 | 成人在线精品 | 午夜a v电影 | 久久三区| 91传媒在线观看 | 91麻豆精品一区二区三区 | 国产在线观 | av无遮挡| 国产精品一区二区在线播放 | 日韩手机在线看片 | 欧美精品一区二区三区四区五区 | 亚洲不卡一 | 3级毛片 | 国产精品久久久久久吹潮 | 成人网av | 日本不卡高清视频 | 日韩精品视频网 | 国产成人一区二区三区久久久 | 成人免费在线播放视频 | caoporn地址| 99精品视频在线观看免费播放 | 午夜国产一级 | 国产玖玖| 中文字幕在线播放第一页 | 国产精品激情小视频 | 美女久久| 欧美精品久久久久 | 成人在线观看免费 | 国产乱码精品1区2区3区 | 亚洲欧美激情精品一区二区 | 91精品国产91久久久久久丝袜 | 日本精品一区二区三区四区 | 2一3sex性hd | 四虎最新视频 | 亚洲视频中文字幕 | 欧美精品一区二区在线观看 | 一级看片免费视频 |

<cite id="scoay"></cite><mark id="scoay"><option id="scoay"></option></mark>

<mark id="scoay"><option id="scoay"></option></mark>

<mark id="scoay"><option id="scoay"></option></mark>