9塊9就能找個女朋友,你還在等什么?
備受關注的第七次人口普查數據近日公布。數據顯示,我國男性比女性人口多出3000余萬,從性別構成年齡段來看,從20歲到40歲這一主要婚育年齡段來看,男性比女性多出1700多萬人。聽到這個數據,不知道大家慌不慌,反正我是不慌,畢竟現在的年輕人都追求自由,要什么對象(假裝不稀罕)。不得不說,近年來,中國人結婚少了、結婚晚了、離婚多了,社會、經濟、環境壓的我們喘不過氣,而高婚育成本更像一座大山,我們在山前徘徊,躊躇等待。
不管怎么說,社會是大家的,生活(對象)是自己的,沒對象的爭取不做那1/17000000,有對象的且過切珍惜。520來了,你是哪種過節姿勢呢?
沒對象的請查收這份孤單指南
1、做個wifi宅,只要還能連上網,你就不是孤獨的,也別問宅著是不是孤單,你都問了,我能說什么。
2、做個剁手族,與其說愛上了網購,不如說愛上了孤單。單身狗都是獨自快樂的,畢竟掙的錢都能自己花,嘻嘻。
3、做個高端玩家,一群單著的人,卻想讓大家都不孤單。你可以選擇在朋友圈接受狗糧投喂,也可以組一個單身局互訴衷腸,畢竟,嘲笑也要一群人更刺激。
4、做個關燈人,為了不孤單,就要承受更多的孤單。做最后一個離開自習室的人,做最后一個下班的人,做最后一個散場的人。
有對象的請查收這份送禮指南
想知道大家都是怎么送禮的么?云朵君特意施展了python大法,在淘寶上爬取了最受歡迎的情人節禮物,看下大家都是怎么選禮物的。
數據爬取
本次數據爬取是采用使用selenium實現動態渲染頁面的爬取。selenium是瀏覽器自動測試框架,模擬瀏覽器,驅動瀏覽器執行特定的動作,并可獲取瀏覽器當前呈現的頁面的源代碼,可見即可爬。
爬蟲中主要是獲取商品數據,其主要代碼如下:
- def get_products():
- '''
- 提取商品數據
- :return:
- '''
- # page_source獲取網頁源代碼
- html = browser.page_source
- doc = pq(html)
- items = doc('#mainsrp-itemlist .items .item').items()
- for item in items:
- # 數據存入字典
- product = {
- 'image': item.find('.pic .img').attr('data-src'),
- 'price': item.find('.price').text(),
- 'deal': item.find('.deal-cnt').text(),
- 'title': item.find('.title').text(),
- 'shop': item.find('.shop').text(),
- 'location': item.find('.location').text(),
- }
- with open(f'./{text}.txt', 'a',encoding='utf-8') as fin:
- fin.write(f"{json.dumps(product, ensure_ascii=False)}\n")
- print(product)
獲取到的原始數據是這樣的
數據清洗
定義清洗函數
- def deal_deal(x):
- s = x.split('人付款')[0]
- if not s:
- return 0
- elif s.endswith('萬+'):
- return int(float(x.split('萬+人付款')[0])*10000)
- elif s.endswith('+'):
- return int(x.split('+人付款')[0])
- else:
- return int(s)
逐個處理每個列
- raw_data = pd.DataFrame(data_list)
- data = raw_data.iloc[:,1:]
- # 單位處理
- data['price'] = data['price'].map(lambda x: float(x.split('¥')[1]))
- data['deal'] = data['deal'].map(lambda x:deal_deal(x))
- data['province'] = data['location'].map(lambda x: x.split()[0])
- # 發貨地拆分
- data['city'] = data['location'].map(lambda x: x.split()[1] if len(x.split()) ==2 else x.split()[0])
- # 刪除無用的列
- data.drop(columns=['location'],inplace=True)
- # 重命名
- data.columns = ['價格','銷量','商品名稱','店鋪名稱','省份','城市']
數據清洗完如下:
數據分析
數據整體分布狀態
銷量和價格都呈現出很明顯的右偏分布,價格越低,銷量越高。看來情人節禮物普遍比較便宜嘛,這樣低成本,高回報的事情,你還在等什么呢?
送禮你選幾塊錢的?
從各價格區間禮物銷量可以看到,100塊以內的禮物占比47.42%,100-200塊的禮物占比24.66%,200-500塊的禮物占比13.16%,說明還是有很多物廉價美的禮物。
按照價格篩選0-100元,并按照銷量從高到低,看看大家都喜歡買些什么?
除了一些創意的定制禮物,更搶眼的是銷量3萬+的玫瑰花,只要九塊九,你就能獲得芳心!
當然送禮最重要的還是心意,心意與價格不是正相關的,禮輕情意重。
送鮮花,選云南
情人節禮物賣的最好的當屬云南!而云南賣的最好的當屬鮮花!眾所周知,昆明斗南的鮮花占據國內70%的市場份額,是中國乃至亞洲最大的鮮切花交易市場,出口46個國家和地區,平均每十枝鮮花里面就有7枝產自斗南,是著名的“花都”和花卉價格的“晴雨表”。
云南才是名副其實的花海,不僅鮮花種類繁多,而且物美價廉啊!兄弟們,不用吝嗇啊,趕緊行動起來!9.9能換個媳婦啊!
看看云南的店在賣什么?
除了玫瑰花,還有網紅花束滿天星,前兩天母親節的康乃馨,還有勿忘我、向日葵等等!
大家都在買什么?
從詞云圖中看到,除了玫瑰花等鮮花外,戒指、手鏈、項鏈等也是很多男性朋友的選擇。挑一件禮物不容易,挑一件她喜歡的禮物更不容易。大家加油!