熬了一夜!雙十一來了,為了幫女友買手機!我分析了上千部手機!
都說碼農不容易,白天寫程序員,晚上熬夜加班,有的時候項目忙的連陪女友的時間都沒有!我容易嗎~~。這不雙十一來了,畢竟全年最優惠的時刻,大家都不想錯過。小編也想幫女友更換一部手機,因此就想著快速的從眾多的手機中挑選出合適的手機。為了女友拼了!于是熬了一夜,看我如何從上千部手機中獲取到信息并進行簡單的信息評分,得到自己最滿意的幾部手機。
首先我們抓取到的是蘇寧平臺的手機信息,一共有2700+條手機信息。包括了手機的價格,名字,好評率、總評價數目和曬圖評價數目和網頁地址等信息。
通過數據清洗,將類別型中含有數值變量缺失值的行刪除,并將其轉化為數值型變量。對于非數值型變量信息,我們不做處理。
01.價格分布信息
對于手機來說,價格是一個重要的信息標簽,小編按照0到1000、1000-2000、2000-3000、3000-5000和5000+分為了5類。
- 可以看出,在所有的銷售手機當中,價格在0-2000的手機類別是最多的,超過了全部手機的一半;
- 這類別中,價格在1000-2000的手機銷售類別數量是最多的。價格在5000+的銷售類別數是最少的;
- 對于大多數廠家,低端機制作技術更容易掌握,低端機更具有性價比;
- 而高端手機需要配合精湛的技術和工藝,而且主打旗艦品牌,因此,銷售的手機類別自然少一些。
02.不同價格下,手機的銷售量
接下來我們來看一下,不同價格區間下的手機的銷售量。這里的話,由于商品信息中,沒有給出明確的銷售數量。所以小編用總的評價數量來代替銷售量。
可以看到雖然2000價位的手機類別數量占據了第一位,但是在購買銷售數量上,3000-5000和5000+的手機占據了上風。日益增長的物質水平,讓大家越來越有錢買價格更高的手機。
03.不同品牌手機類別
那對于不同的手機類別,他們的手機類別如何呢?
在手機銷售類別中,華為手機銷售類別是最多的,緊隨其后的是小米和蘋果。而上述的五家公司的手機銷售類別,已經占到了整個市場的73.22%,這也比較符合當下我國的手機市場現狀。
04.簡單的手機挑選
經過了簡單的數據分析后,接下來就是手機的挑選了。女友的要求很簡單,價格在2000-3000之間的,品牌不做要求。在這個狀況下,可以根據手機價格在2000-3000之間的進行篩選,然后根據手機的好評率、總評價數、帶圖評價率、手機價格和帶圖評價率/總評價數這五個特征來進行帶權重的評分,并按照評分進行手機的挑選。
上圖中,每個特征都有一個權重,權重是根據自己的喜好來進行設定。將最終的結果進行相加得到我們的最終值。首先,對于每個特征,我們需要進行歸一化處理,防止不同特征的數量級不同而帶來的偏差,然后我們設置每個特征的權重,然后將結果相加,得到最終的結果。
一頓操作猛如虎,對于五個特征進行歸一化處理,然后根據權重來計算總的得分,得分結果如程序上方圖所示。最后從幾千個手機里面挑選出華為的Nova5,小米的紅米K30。
以上就是小編熬了一夜,分析出來的結果,今天準備下單了。