成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

全國41611個景點,用Python告訴你哪些地方更值得一游!

大數據 數據分析 后端
都知道中國地廣人不稀,旅游資源非常豐富,古文化遺址、抗戰遺址、山川、河流等等,在選擇目的地的時候,不少人都會非常糾結,不知道去哪更好。為了以后不再糾結,筆者打算深度解析全國的旅游景點分布。

經常聽到別人說“世界那么大,我想去看看”。在有機會走出***之前,還是先把祖國走一圈吧。都知道中國地廣人不稀,旅游資源非常豐富,古文化遺址、抗戰遺址、山川、河流等等,在選擇目的地的時候,不少人都會非常糾結,不知道去哪更好。為了以后不再糾結,筆者打算深度解析全國的旅游景點分布。

以下進入正題。

01、數據抓取

去哪兒網有著非常豐富的旅游信息,不但幾乎涵蓋了全國所有景點,而且使用去哪兒網購買景區門票的人也非常多,所以筆者將爬取去哪兒網全國 32 個省市的所有景點數據。(沒有抓取香港和澳門的數據,這邊的景點并沒有分 ***、4A)

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

去哪兒網的門票服務中暫時還沒有開通 API 服務,所以只能對網頁解析爬取。要抓取的數據有:景點名、景區等級、地點、景區簡述、價格、銷量以及熱度。

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

將需要的數據進行定位,一層一層解析,就可以把所需的全部內容抓取下來了。但并不是每一個景點的信息都是全的,所以筆者加了一個 try/except 進去,雖然代碼有變長,但是整個程序變得更加健壯。最終,一共抓取了 41611 條景點信息。

for i in s:
inf = {}
try:
inf['level'] = i.find('span', class_='level').text[0]
except Exception as e:
inf['level'] = '0'
try:
inf['price'] = i.find('span', class_='sight_item_price').find('em').text
except Exception as e:
inf['price'] = ''
try:
inf['name'] = i.find('a', class_='name').text
except Exception as e:
inf['name'] = ''
try:
inf['num'] = i.find('span', class_='hot_num').text
except Exception as e:
inf['num'] = ''
try:
inf['add_pro'] = i.find('span', class_='area').find('a').text.split('·')[0]
inf['add_city'] = i.find('span', class_='area').find('a').text.split('·')[1]
except Exception as e:
inf['add_pro'] = i.find('span', class_='area').find('a').text
inf['add_city'] = i.find('span', class_='area').find('a').text
try:
inf['hot'] = i.find('span', class_='product_star_level').find('em').get('title').split(':')[1]
except Exception as e:
inf['hot'] = ''
try:
inf['descri'] = i.find('div', class_='intro color999').text
except Exception as e:
inf['descri'] = ''

02、數據分析

*** 級景區

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

上圖為 *** 景區的銷量排行,可以看出秦始皇兵馬俑***,是第二名長隆歡樂世界的 5/3 倍。讓筆者沒有想到的是歡樂谷游樂園等在前二十名中占了六個席位,所以對于那些想發展旅游業但是沒有美麗風景或者歷史古跡的城市而言,大力發展游樂園行業是一個不錯的選擇。廣州長隆就是一個鮮活的例子。

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

江蘇省是全國 *** 級景區最多的一個省,有 41 個之多;其次是浙江省和廣東省有 21 個。總體而言,東部地區的 *** 景區數量是遠高于西部的,雖然西部的美景非常多,但是整體經濟不行,對景區的開發力度不夠,拉了不少后退。

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

如果大家想去人少景美的地方,可以參考上圖。比如武漢的東湖磨山、紅旗渠、野三坡等等(其實筆者都沒有聽過。)雖然它們的銷量低,但好歹也是 AAAAA 級風景區。

def huati(name,num,k):
kk=[]
for i in range(len(name)):
if not numpy.isnan(num[i]):
q = []
q.append(name[i])
q.append(num[i])
kk.append(q)
hh=sorted(kk,key=lambda i:i[1],reverse=True)
page=Page()
att,val=[],[]
for i in hh[:20]:
att.append(i[0])
val.append(i[1])
bar1 = Bar("", k+"A景區銷量排行", title_pos="center", width=1200, height=600)
bar1.add("",att,val, is_visualmap=True, visual_text_color='#fff', mark_point=["average"],
mark_line=["average"],
is_more_utils=True, is_label_show=True, is_datazoom_show=True, xaxis_rotate=45)
page.add_chart(bar1)
att, val = [], []
for i in hh[-20:]:
att.append(i[0])
val.append(i[1])
bar2 = Bar("", k+"A景區銷量排行", title_pos="center", width=1200, height=600)
bar2.add("", att, val, is_visualmap=True, visual_text_color='#fff', mark_point=["average"],
mark_line=["average"],
is_more_utils=True, is_label_show=True, is_datazoom_show=True, xaxis_rotate=45)
page.add_chart(bar2)
page.render(k+"A景區銷量bar.html")
def sum_pro(pro,k):#每個省有多少個景點
p=[]
c=[]
for i in set(pro):
'''
q={}
q[i]=pro.count(i)
p.append(q)'''
p.append(i)
c.append(pro.count(i))
map= Map('各省'+k+'A景點分布', width=1200, height=600)
map.add("", p,c, is_visualmap=True, visual_range=[min(c), max(c)],
visual_text_color='#000', is_map_symbol_show=True, is_label_show=True)
map.render( '各省'+k+'A景點分布.html')

4A 景區

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

在 4A 景區里,成都熊貓基地的銷量是***的,大熊貓最為國寶,這吸引力真是杠杠的。和 *** 景區一樣,歡樂谷游樂園等占了四成,我想這也是南京雖然是六朝古都,又是中華民國的首都,可是景區無論銷量還是人氣都不高的原因吧,希望在南京可以多造幾個大型游樂園!

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

在上圖中可以看到山東省是 4A 景區最多的省,有 167 個之多。而浙江省、江蘇省、廣東省、河北省、四川省、安徽省的 4A 景區數量均超過了 100。4A 景區最少的省是西藏,只有 6 個。

3A 景區

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

3A 景區銷量***的是竹林長壽山景區,但也只有 1326,在 4A 景區的中上游。

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

山東省的 3A 景區數量***,高達 211 個,而河南省、安徽省、遼寧省、黑龍江省、新疆省 3A 景區均在 100 個以上。

綜合對比

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

從各等級景區人氣值可以看出,人氣值為 1 的 *** 景區占了將近三成,而 4A 和 3A 景區連一成都沒有;相反,人氣值為 0 的 3A 景區差不多有六成,看來這個 3A 景區不是一點點水呢?*** 景區也并非每一個都稱得上 *** 這個名號,不然也不會有近兩成人氣值為 0。

def hottt(fivhot,fouhot,thrhot):
fiv, fou, th = [], [], []
atts = ['0', '0.7', '0.8', '0.9', '1']
for i in zip(fivhot,fouhot,thrhot):
fiv.append(round(i[0], 1))
fou.append(round(i[1], 1))
th.append(round(i[2], 1))
levels = ['***', '4A', '3A']
data = {}
data['att'] = atts
data['***'], data['4A'], data['3A'] = [], [], []
for i in range(len(atts)):
data['***'].append(round(fiv.count(float(atts[i])) / len(fiv) * 100, 3))
data['4A'].append(round(fou.count(float(atts[i])) / len(fou) * 100, 3))
data['3A'].append(round(th.count(float(atts[i])) / len(th) * 100, 3))
print(data)
output_file("bars.html") # 輸出文件名
x = [(att, level) for att in atts for level in levels]
counts = sum(zip(data['***'], data['4A'], data['3A']), ())
source = ColumnDataSource(data=dict(x=x, counts=counts))
p = figure(x_range=FactorRange(*x), plot_height=250, title="各等級景區人氣值占比",
toolbar_location=None, tools="")
p.vbar(x='x', top='counts', width=0.9, source=source)
show(p)

 

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

從各級景點的箱型圖可以看出,*** 景區人氣值是***的,整體在 0.7 以上。4A 景區人氣均值中位數在 0.7 左右,不過高于 0.7 的景區實在太少了。3A 景區就更不用說,整體人氣值非常低。

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

從景區銷量箱型圖可以看到:*** 景區的銷量是遠超過了 4A 和 3A 景區,*** 景區的 3/4 分為點達到了 400,而 4A 景區的僅為 82;而 4A 景區的箱型圖和 3A 的非常類似;看來大家對 4A 景區和對 3A 景區興趣都一致的不大。

def box(q,w,e,l):
a = go.Box(y=q, name='***景區')
b = go.Box(y=w, name='4A景區')
c = go.Box(y=e, name='3A景區')
g = go.Box(y=l, name='所有景區')
data = [a, b, c,g]
layout = go.Layout(legend=dict(font=dict(size=16)), orientation=270)
fig = go.Figure(data=data, layout=layout)
plotly.offline.plot(data)

 

 


?全國41611個景點,用Python告訴你哪些地方最值得一游!?

 

將所有景點的概述用 R 生成了一個詞云圖:位于,文化,休閑,旅游,體驗,景區,公園,歷史,娛樂等等這些詞是不是很熟悉呢。看來商家對景區的概括都差不多。

對比完各級景點,下面來給各位看官排排雷。

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

上圖是 4A 級景區銷量排名的*** 20 位,全中國有 2193 個 4A 級景區,這 20 個還排在***,在對比一下大家對 4A 級景區的人氣評分,想想還是不要去了。

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

首先,如果說 3A 級景區不太推薦大家去游玩,因為人氣值實在低的可怕;那上面列出的這 20 個景點那就是完全不建議游玩了。全國一共 1933 個 AAA 級景區,這 20 個排在***,可想而知去了會多么震驚了。

高德地圖可視化

高德地圖的 API 真的非常好,它提供各種和地圖有關的功能。其中有一項是 WEB 服務里的地理/逆地理編碼。將去哪兒爬取到的景點地址數據通過地理編碼轉變為對應的經緯度。比如:北京市方恒國際中心 A 座將它經過地理編碼后其經緯度為 116.480656,39.989677。它的 URL:

其中 output 是輸出個格式,一共有兩種,XML 和 JSON;address 是要地理編碼的地址,city 是所在的城市。

?全國41611個景點,用Python告訴你哪些地方最值得一游!?

Word is cheap,show me the code!

def trans(city,name,pro,level):
for i in range(len(name)):
x = pandas.DataFrame()
t={}
add = name[i]
chengshi=city[i]
parameters = { 'address': add, 'key': '','city':chengshi }
html = requests.get('https://restapi.amap.com/v3/geocode/geo',
params=parameters).json()
try:
t['jingwei'] = html['geocodes'][0]['location']
except IndexError:
t['jingwei']='0,0'
finally:
t['n'] = name[i]
t['level']=level[i]
t['pro']=pro[i]
t['city']=city[i]
x = x.append(t, ignore_index=True)
x.to_csv('55543.csv', encoding='utf-8', index=False, mode='a', header=False)

全國各級景區分布圖

全國各級景區分布六邊形熱力圖

在六邊形熱力圖中可以看到,北京是一個旅游資源及其豐富的城市,如果大家只想去一個城市轉一轉,可以優先選擇北京。重慶、廣州、天津、蘇州等也是不錯的選擇。

全國景區分布熱力圖

筆者做了一個全國旅游景點分布軌跡的動畫,鏈接如下:

  • lbs.amap.com/dev/mapdata/share/7b986430c10e197fcb5babbddd510c67

***來看看筆者的家鄉,湖南。如果大家去湖南游玩的話,長沙一定要去!其次張家界、永州、懷化和郴州也值得一去。

?全國41611個景點,用Python告訴你哪些地方最值得一游! ?

相關代碼和數據已經上傳到GitHub:

??https://github.com/zuobangbang/qunaer??

責任編輯:未麗燕 來源: zuobangbang
相關推薦

2019-09-29 10:00:46

Python程序員旅游

2021-09-06 11:57:30

Python

2021-04-27 09:33:41

Python北京景點

2017-09-17 10:05:20

Python景點國慶

2022-07-14 16:38:07

Python爬蟲

2017-11-03 12:05:09

機房排查安全

2010-03-02 08:36:40

Windows 7優點

2018-07-13 10:02:48

機房隱患排查

2016-03-21 14:33:23

JavaPython程序員

2018-11-06 13:24:27

爬蟲分析房租

2017-09-29 09:29:32

架構技術棧微信半月刊

2021-11-12 14:10:53

IT大數據大數據應用

2021-01-27 14:10:08

大數據年貨網購

2011-12-02 17:05:52

iPhone 4S

2017-10-26 13:40:11

Python一行代碼

2009-04-23 11:59:20

2016-02-22 10:46:02

Java排行第一

2019-10-24 08:39:47

Python閑魚數據

2015-09-21 14:22:43

2020-02-02 19:53:57

數據庫數據庫優化SQL優化
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品国产乱码久久久久久蜜柚 | wwww.xxxx免费 | 亚洲精品一区二区三区在线观看 | 久久久91精品国产一区二区三区 | 久久一级| 久久精品国产99国产 | 欧美日韩精品久久久免费观看 | 日本中文字幕视频 | 精品日韩在线 | 国产一区二区在线视频 | 久久不卡日韩美女 | 中文字幕久久久 | 久久激情网 | 一级片在线观看视频 | 欧美一级二级三级 | 欧美色视频免费 | 91在线中文字幕 | 亚洲国产aⅴ成人精品无吗 国产精品永久在线观看 | 在线播放国产一区二区三区 | 天天躁日日躁狠狠躁2018小说 | 亚洲精品68久久久一区 | 97精品一区二区 | 久久大陆| 精品久久久久久久 | 欧美日韩高清免费 | 国产欧美精品一区二区 | 欧美videosex性极品hd | 黄色片免费看视频 | 国产一区二区在线播放视频 | 国内久久 | 日本高清不卡视频 | 国产精品91久久久久久 | 99免费| 奇米久久 | 91精品国产777在线观看 | 91视频大全 | 亚洲人人| 免费一级欧美在线观看视频 | 日韩免费看视频 | 麻豆changesxxx国产 | 日韩三级电影一区二区 |