成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用Python分析大連景點,告訴你哪些景點性價比高

開發 后端
去哪兒網的數據存儲非常簡單,都在源網頁中靜態存儲,我們只需構造好URL之后,用Requests發起請求,然后用Bs4將數據提取出來,存儲到Excel中即可。

[[422047]]

本文轉載自微信公眾號「志斌的python筆記」,作者志斌。轉載本文請聯系志斌的python筆記公眾號。

大家好,我是志斌~

再過幾天,志斌就要去大連開始為期三年的讀研生活啦,當然在讀書學習的同時,也要去體驗一下“魅力之都”的魅力,所以志斌用Python爬取了去哪兒網上大連景點的相關數據,包括景點名稱、城區、熱度、價格、月銷量等數據,對數據進行可視化并作簡單分析,用以找到性價比較高的景點。

一數據采集

去哪兒網的數據存儲非常簡單,都在源網頁中靜態存儲,我們只需構造好URL之后,用Requests發起請求,然后用Bs4將數據提取出來,存儲到Excel中即可。

爬蟲的核心代碼如下:

  1. import requests 
  2. from bs4 import BeautifulSoup 
  3. import openpyxl 
  4.  
  5. for page in range(1,50): 
  6.   try: 
  7.       params = ( 
  8.           ('from''mps_search_suggest_h'), 
  9.           ('keyword''大連'), 
  10.           ('page', str(page)), 
  11.       ) 
  12.       response = requests.get('https://piao.qunar.com/ticket/list_%E8%A5%BF%E5%AE%89.html', headers=headers, params=params) 
  13.       soup = BeautifulSoup(response.text,'html.parser'
  14.       zongs = soup.find_all('div',class_='sight_item'
  15.       for i in zongs: 
  16.           name = i.find('h3').text 
  17.           diqu = i.find(class_='area').find('a').text 
  18.           redu = round(float(i.find(class_='product_star_level').text.split()[-1][:4]) * 5, 2) 
  19.         dizhi = re.findall('地址:(.*?)地圖', i.find(class_='address color999').text)[0] 
  20.           jiage = float(i.find(class_='sight_item_price').find('em').text) 
  21.           yuexiao = int(i.find(class_='sight_item_sold-num').find('span').text) 
  22.           xingji = i.find(class_='level'
  23.           jingweidu = i['data-point'
  24.           ~~~ 

二數據處理

01導入景點數據

用pandas讀取爬取的景點數據并預覽。

  1. import pandas as pd 
  2. df = pd.read_excel('大連景區數據_1.xlsx',names=['景點名稱','城區','熱度','地址','價格','月銷量','星級','經度','緯度']) 
  3. print(df.head()) 

02刪除重復數據

網站中有一定的重復數據,需要將其刪除。

  1. df = df.drop_duplicates() 

03查看數據信息

查看字段類型和缺失值情況,符合分析需要,無需另做處理。

  1. df.info() 

三可視化分析

我們來對這164個景點數據進行可視化分析。

01景點介紹

通過對大連景點介紹進行詞云圖繪制,我們很容易看出大連的特點。博物館、休閑、歷史、文化等詞的大量提及,說明大連是一座歷史悠久的現代化城市。建筑、動物、主題等詞也有很多提及,表明大連的旅游環境輕松且多樣。

代碼如下:

  1. with open("推薦語.txt",) as f: 
  2.    job_title_1 = f.read() 
  3. contents_cut_job_title = jieba.cut(job_title_1) 
  4. contents_list_job_title = " ".join(contents_cut_job_title) 
  5. wc = WordCloud(stopwords=STOPWORDS.add("一個"), collocations=False
  6.               background_color="white"
  7.               font_path=r"K:\msyh.ttc"
  8.               width=400, height=300, random_state=42, 
  9.               mask=imread('xin.jpg', pilmode="RGB"
  10.               ) 
  11. wc.generate(contents_list_job_title) 
  12. wc.to_file("推薦語.png"

02景區熱度top10

從景點評分來看,金石灘景點評分最高,為4.55分,其次是老虎灘公園和星海廣場,分別是4.5分和4.4分。怪不得一搜索大連的旅游攻略,每一個里面都有這幾個景點。

03景點價格top10

從景點價格來看,除了潛水中心這個景點略貴,其他景點價格都還可以接受,去大連游玩的朋友,時間充裕的話可以都體驗一下,志斌這三年是要都體驗一遍了~

04月銷量top10景點

從下圖可以看出,海昌發現王國的銷量最高,為908,其次是天門峽漂流,為786,志斌還沒去過漂流,正好趁著這次在大連讀書,抽時間去一次。

老虎灘海洋公園、大連森林動物園、大連圣亞海洋世界的銷量也不少,分別是542,488,458。

05月銷額top20景點

從下圖可以看出、月銷額較大的還是海昌發現王國、老虎灘海洋公園、大連圣亞海洋世界、看來月銷額受到月銷量的影響較大,受價格的影響較小。

06景點等級分布

從大連景點等級分布來看,3A以上等級的景點為24個,其中3A級景點1個,4A級景點21個,5A級景點2個。

07景點分布

從圖中我們可以看出,景點大部分分布在旅順區、中山區、金州區的東南沿海方位。如果來大連旅游的話,建議去旅順口區或者中山區去住,因為那里交通較為便利。

四小結

通過上面簡單的分析,我們大致可以獲得以下幾點發現:

1. 大連是一座歷史悠久的現代化城市,很適合旅游。

2. 大連的景點主要集中在旅順區、中山區、金州區,旅順區和中山區的景點附近有地鐵,所以建議住宿的時候可以盡量選擇住在這兩個區,這樣出行游玩會比較方便。

3. 評分最高的景點是金石灘景點。

4. 本文僅供學習參考,不做它用。

溫馨提示:疫情還未結束,外出旅行做好個人防護。盡量避免到中高風險地區游玩。

 

責任編輯:武曉燕 來源: 志斌的python筆記
相關推薦

2021-04-27 09:33:41

Python北京景點

2019-09-29 10:00:46

Python程序員旅游

2018-11-28 10:23:01

Python旅游景點數據

2017-09-17 10:05:20

Python景點國慶

2012-08-20 09:56:48

大數據

2019-10-24 08:39:47

Python閑魚數據

2012-06-21 14:56:00

明基投影機

2012-01-17 13:53:17

惠普激光打印機

2021-07-05 05:30:37

AR物布空間應用

2012-07-25 10:45:04

打印機

2018-11-06 13:24:27

爬蟲分析房租

2017-09-29 09:29:32

架構技術棧微信半月刊

2011-10-08 17:17:53

雅圖投影儀

2012-07-03 12:21:22

聯想筆記本

2019-05-05 09:14:19

數據.

2018-07-27 14:04:24

數據分析薪資數據分析師

2012-02-08 14:22:20

理光復合一體機

2011-06-21 16:13:57

夏普傳真機

2017-09-01 14:34:33

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品在线一区 | 亚洲成人一区二区 | 国产精品日产欧美久久久久 | 狠狠爱免费视频 | 久久久久久一区 | 精品一区国产 | 一区二区免费 | 亚洲精品国产电影 | 91精品国产日韩91久久久久久 | 日韩视频一级 | 国产色网站 | 亚洲欧洲精品成人久久奇米网 | 91精品久久久久久久久中文字幕 | 天堂亚洲 | 操操操日日日 | 日韩精品三区 | 韩日有码 | 久久国产区 | 精品久久久久久亚洲精品 | 久久久www成人免费精品 | 国产成人av在线播放 | 久久一区二区三区四区 | 综合欧美亚洲 | 黄网站在线播放 | 欧美在线视频一区 | 精品久久香蕉国产线看观看亚洲 | 日本在线网站 | 国产国语精品 | 日本一区精品 | 国产精品视频一区二区三区 | 色婷婷久久久久swag精品 | 国产精品视频久久久久久 | 日韩欧美1区2区 | 国产高清免费 | 91精品国产综合久久久动漫日韩 | 久久免费资源 | 国产精品一区二区久久 | 久久久久国产一区二区三区不卡 | 在线观看国产精品视频 | 五月天综合网 | 欧美激情精品久久久久 |