成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Python數據可視化:網易云音樂歌單

大數據 數據可視化
本次通過對網易云音樂華語歌單數據的獲取,對華語歌單數據進行可視化分析。可視化庫不采用pyecharts,來點新東西。使用matplotlib可視化庫,利用這個底層庫來進行可視化展示。

網易云音樂2018年度聽歌報告—遇見你,真好。

相信有不少人在上周,應該已經看過自己網易云音樂的年度報告了。

小F也是去湊湊熱鬧,瞅了一波自己的年度聽歌報告。

那么你在云村又聽了多少首歌,聽到最多的歌詞又是什么呢?

2018年你的年度歌手又是誰,哪些又是你***的歌呢?

不過相比去年,我的票圈并沒有很多發自己年度報告的朋友。

不得不說,版權之爭開始,網易云音樂似乎就在走下坡路。

很多喜歡的歌聽不了,這應該是大家共同的痛點。

***的印象就是周董的歌,在愚人節時下架了,原以為只是個玩笑,不想卻是真的。

本次通過對網易云音樂華語歌單數據的獲取,對華語歌單數據進行可視化分析。

可視化庫不采用pyecharts,來點新東西。

使用matplotlib可視化庫,利用這個底層庫來進行可視化展示。

一、網頁分析

01 歌單索引頁

Python數據可視化:網易云音樂歌單

選取華語熱門歌單頁面。

獲取歌單播放量,名稱,及作者,還有歌單詳情頁鏈接。

本次一共獲取了1302張華語歌單。

02 歌單詳情頁

Python數據可視化:網易云音樂歌單

獲取歌單詳情頁信息,信息比較多。

有歌單名,收藏量,評論數,標簽,介紹,歌曲總數,播放量,收錄的歌名。

這里歌曲的時長、歌手、專輯信息在網頁的iframe中。

需要用selenium去獲取信息,鑒于耗時過長,小F選擇放棄...

有興趣的小伙伴,可以試一下哈...

二、數據獲取

01 歌單索引頁

  1. from bs4 import BeautifulSoup 
  2. import requests 
  3. import time 
  4.  
  5. headers = { 
  6.     'User-Agent''Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36' 
  7.  
  8. for i in range(0, 1330, 35): 
  9.     print(i) 
  10.     time.sleep(2) 
  11.     url = 'https://music.163.com/discover/playlist/?cat=歐美&order=hot&limit=35&offset=' + str(i) 
  12.     response = requests.get(url=url, headers=headers) 
  13.     html = response.text 
  14.     soup = BeautifulSoup(html, 'html.parser'
  15.     # 獲取包含歌單詳情頁網址的標簽 
  16.     ids = soup.select('.dec a'
  17.     # 獲取包含歌單索引頁信息的標簽 
  18.     lis = soup.select('#m-pl-container li'
  19.     print(len(lis)) 
  20.     for j in range(len(lis)): 
  21.         # 獲取歌單詳情頁地址 
  22.         url = ids[j]['href'
  23.         # 獲取歌單標題 
  24.         title = ids[j]['title'
  25.         # 獲取歌單播放量 
  26.         play = lis[j].select('.nb')[0].get_text() 
  27.         # 獲取歌單貢獻者名字 
  28.         user = lis[j].select('p')[1].select('a')[0].get_text() 
  29.         # 輸出歌單索引頁信息 
  30.         print(url, title, play, user
  31.         # 將信息寫入CSV文件中 
  32.         with open('playlist.csv''a+', encoding='utf-8-sig'as f: 
  33.             f.write(url + ',' + title + ',' + play + ',' + user + '\n')

獲取歌單索引頁信息如下,共1302張華語歌單。

Python數據可視化:網易云音樂歌單

02、歌單詳情頁

  1. from bs4 import BeautifulSoup 
  2. import pandas as pd 
  3. import requests 
  4. import time 
  5.  
  6. df = pd.read_csv('playlist.csv', header=None, error_bad_lines=False, names=['url''title''play''user']) 
  7.  
  8. headers = { 
  9.     'User-Agent''Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36' 
  10.  
  11. for i in df['url']: 
  12.     time.sleep(2) 
  13.     url = 'https://music.163.com' + i 
  14.     response = requests.get(url=url, headers=headers) 
  15.     html = response.text 
  16.     soup = BeautifulSoup(html, 'html.parser'
  17.     # 獲取歌單標題 
  18.     title = soup.select('h2')[0].get_text().replace(','','
  19.     # 獲取標簽 
  20.     tags = [] 
  21.     tags_message = soup.select('.u-tag i'
  22.     for p in tags_message: 
  23.         tags.append(p.get_text()) 
  24.     # 對標簽進行格式化 
  25.     if len(tags) > 1: 
  26.         tag = '-'.join(tags) 
  27.     else
  28.         tag = tags[0] 
  29.     # 獲取歌單介紹 
  30.     if soup.select('#album-desc-more'): 
  31.         text = soup.select('#album-desc-more')[0].get_text().replace('\n''').replace(','','
  32.     else
  33.         text = '無' 
  34.     # 獲取歌單收藏量 
  35.     collection = soup.select('#content-operation i')[1].get_text().replace('(''').replace(')'''
  36.     # 歌單播放量 
  37.     play = soup.select('.s-fc6')[0].get_text() 
  38.     # 歌單內歌曲數 
  39.     songs = soup.select('#playlist-track-count')[0].get_text() 
  40.     # 歌單評論數 
  41.     comments = soup.select('#cnt_comment_count')[0].get_text() 
  42.     # 輸出歌單詳情頁信息 
  43.     print(title, tag, text, collection, play, songs, comments) 
  44.     # 將詳情頁信息寫入CSV文件中 
  45.     with open('music_message.csv''a+', encoding='utf-8-sig'as f: 
  46.         f.write(title + ',' + tag + ',' + text + ',' + collection + ',' + play + ',' + songs + ',' + comments + '\n'
  47.     # 獲取歌單內歌曲名稱 
  48.     li = soup.select('.f-hide li a'
  49.     for j in li: 
  50.         with open('music_name.csv''a+', encoding='utf-8-sig'as f: 
  51.             f.write(j.get_text() + '\n'

獲取的1302張華語歌單的詳情。

Python數據可視化:網易云音樂歌單

 

 

1302張歌單里的121118首歌。

Python數據可視化:網易云音樂歌單

 

 

三、數據可視化

可視化代碼已上傳GitHub,點擊左下角閱讀原文即可訪問!!!

01 歌曲出現次數 ***0

Python數據可視化:網易云音樂歌單

 

榜上的十首歌,除了「水星記」,小F聽得次數都不少。

那么你又是如何的呢?

在小F的印象里,這些歌都曾在網易云音樂熱歌榜的榜首出現過。

02 歌單貢獻UP主 ***0

Python數據可視化:網易云音樂歌單

 

10大歌單貢獻UP主,感謝這些辛勤的“搬運工”,給大家帶來優質的歌單。

給廣大懶人癌患者,亦或選擇困難癥患者,帶來福利。

03 歌單播放量 ***0

Python數據可視化:網易云音樂歌單

 

歌單播放量前十名單,***名7000多萬播放量。

其實matplotlib生成的圖是挺清楚的,只不過一上傳就變模糊了。

所以這里你可能會覺得圖片質量不行...

其實并不是,為此小F做了相應的圖表,具體見文末~

04 歌單收藏量 ***0

Python數據可視化:網易云音樂歌單

 

同樣是好東西,收藏收藏!!!

有一些歌單和播放量***0里歌單有重復。

05 歌單評論數 ***0

Python數據可視化:網易云音樂歌單

 

歌單「再見大俠:武俠小說泰斗金庸逝世」評論數最多。

相信不少人的閱讀時光,就是與金庸前輩的武俠小說一起度過。

飛雪連天射白鹿,笑書神俠倚碧鴛。

還有由小說改編成的電視劇,都是經典!!!

小F武俠小說看的少,武俠電視劇看的多...

06 歌單收藏數量分布情況

Python數據可視化:網易云音樂歌單

 

將收藏數做對數處理,使得能直觀看出歌單收藏數的分布。

主要分布在0-15萬之間(ln(150000)=12)。

07 歌單播放數量分布情況

Python數據可視化:網易云音樂歌單

 

歌單播放數主要分布在0-1000萬。

其中ln(10000000)=16。

08 歌單標簽圖

Python數據可視化:網易云音樂歌單

 

既然選取的是華語歌單,那么華語這二字必不可少,而且還占大頭。

那么就看看除了華語,還有什么其他標簽。

「流行」沒啥好說的。

「古風」「說唱」「民謠」近些年來熱度是越來越高,不過也有玩壞的時候。

比如「離人愁」、「一人我飲酒醉」,小F作為吃瓜群眾,只能說且行且珍惜...

09 歌單介紹詞云圖

Python數據可視化:網易云音樂歌單

 

歌單介紹詞云圖,希望你能找到你喜歡某首歌的原因!!!

到底是希望,還是青春,亦或是回憶呢?

四、總結

***,把本次搜刮的干貨,分享給大家。

Python數據可視化:網易云音樂歌單

Python數據可視化:網易云音樂歌單

Python數據可視化:網易云音樂歌單

可視化及相關代碼都放「GitHub」上頭了。

GitHub:https://github.com/Tobby-star/music_163

作者:法納斯特,Python愛好者,喜歡爬蟲,數據分析以及可視化。

責任編輯:未麗燕 來源: 法納斯特
相關推薦

2018-05-14 14:02:41

Python爬蟲網易云音樂

2023-06-12 07:44:21

大數據數據治理

2020-03-11 14:39:26

數據可視化地圖可視化地理信息

2017-10-14 13:54:26

數據可視化數據信息可視化

2022-08-26 09:15:58

Python可視化plotly

2013-03-04 10:57:01

網易云音樂

2020-05-26 11:34:46

可視化WordCloud

2022-02-23 09:50:52

PythonEchartspyecharts

2022-09-21 23:29:15

Python點云數據

2024-08-20 18:16:49

數據可視化Python

2021-05-26 10:21:31

Python音樂軟件包

2017-10-31 09:38:53

大數據數據可視化Python

2018-11-30 10:28:44

Python反爬網頁

2015-08-20 10:00:45

可視化

2023-02-08 19:32:27

大數據

2018-12-03 16:50:23

數據可視化數據分析薪水

2018-11-21 14:38:09

分析在數據電影

2019-01-02 11:59:26

Python數據可視化GDP

2022-09-29 11:16:21

Python數據可視化

2019-01-21 15:10:11

佩奇可視化數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: a视频在线 | 国产精品久久久久久久久久了 | 国产精品免费观看视频 | 在线一区 | 国产精品成人一区二区 | 国产精品久久久久久久久久久久 | 黄色免费网 | 久久亚洲精品国产精品紫薇 | 亚洲一区二区三区视频在线 | 国产成人精品久久二区二区91 | 亚洲国产精品第一区二区 | 国内精品久久久久 | 亚洲精品乱码久久久久久久久久 | 久久久人成影片免费观看 | 日本在线看片 | 日韩av一区二区在线观看 | 精品日韩一区 | 欧美中文字幕一区二区三区亚洲 | 超碰人人在线 | 亚洲二区视频 | 激情欧美一区二区三区中文字幕 | h片免费看 | 国产一区二区精品在线观看 | 影音先锋中文字幕在线观看 | 成人精品国产免费网站 | 视频一区在线观看 | h视频免费观看 | 久久国产精品色av免费观看 | 日日干夜夜操 | 一区二区三区四区免费在线观看 | 久久蜜桃资源一区二区老牛 | 欧美视频一区 | 欧美四虎 | 国产亚洲第一页 | 日韩精品一区二区三区中文在线 | 欧美日韩久久精品 | 国产成人精品久久二区二区 | 手机看片169 | 成人1区| 亚洲精品成人在线 | 亚洲国产精品一区二区三区 |