縱觀30年5000多部國產電視劇,豆瓣評分最低的演員原來是……
前言:
隨著社會的發展,越來越多的電視劇出現在了電視的熒幕或是視頻網站。其中有許多的精品,例如經久不衰的《西游記》《紅樓夢》,亦或是近年來口碑十分不錯的《瑯琊榜》《白夜追兇》,然而也有一些電視劇,因為種種原因,并不是很盡如人意。
今天我們通過爬取豆瓣上近5000部有評分的國產電視劇(不包括港臺劇),對比一下劇集以及參演演員的評分情況。
01數據來源
本次我們爬取的數據來源主要分為三個部分:分別是有評分的劇集列表、劇集評分及其他信息、演員信息,對應如下三個頁面:
PART1:劇集列表
PART2:劇集信息
PART3:演員信息
通過爬取以上三個頁面的數據,我們可以獲得完整的電視劇評分及演員信息數據,用于之后的數據對比及可視化,我們以爬取***部分的代碼為例,展示整體爬取思路:
- driver = webdriver.Chrome()
- driver.maximize_window()
- driver.close()
- driver.switch_to_window(driver.window_handles[0])
- url = 'https://movie.douban.com/tag/#/?sort=U&range=2,10&tags=%E7%94%B5%E8%A7%86%E5%89%A7,%E4%B8%AD%E5%9B%BD%E5%A4%A7%E9%99%86'
- js='window.open("'+url+'")'
- driver.execute_script(js)
- driver.close()
- driver.switch_to_window(driver.window_handles[0])
- while True:
- try:
- js="var q=document.documentElement.scrollTop=10000000"
- driver.execute_script(js)
- driver.find_element_by_class_name('more').click()
- time.sleep(2)
- except:
- break
- name = [k.text for k in driver.find_elements_by_class_name('title')]
- score = [k.text for k in driver.find_elements_by_class_name('rate')]
- url = [k.get_attribute('href') for k in driver.find_elements_by_class_name('item')]
- pd.DataFrame({'name':name,'score':score,'url':url}).to_excel('電視劇名稱.xlsx')
02劇集對比
我們在劇集對比部分主要展示兩部分數據,首先是***5以及BOTTOM15的劇集評分及拍攝年代:
可以看到十分鮮明的對比,評分較高的劇集大多拍攝年份劇集都有一定的年頭,并且歷經時間的考驗,愈發展示其獨特的魅力。相反,一些評分較低的劇集,往往都是近年來拍攝的,可能這也與劇集增多有關。需要提醒的是榜單中的《尋秦記》不是古天樂版本,那是經典中的經典,至于榜單中出現的版本,大家可以有機會親自去了解一下
正所謂沒有無緣無故的愛,也沒有無緣無故的恨,我們也選取了豆瓣當中對于劇集的一些有意思的點評。通過點評,讓我們了解這些評分產生的原因:
TOP篇:
- 許多年以后觀看發現,其中造型與性格塑造***,準確把握原著,時代影響力巨大,印象極其深刻。------《西游記》
- 老一代影藝人是以一種虔誠的態度對待紅樓夢的,87版之后,世間再無真人版紅樓。------《紅樓夢》
- 這就是我的圣經,思想啟蒙之作 ------《我愛我家》
- 鞋兒破 帽兒破 身上的袈裟破 你笑我 他笑我 一把扇兒破 經典 ------《活佛濟公》
- 絕對是國產情景喜劇無法超越的***之作!其中每個角色都是無法復制的! ------《武林外傳》
BOTTOM篇:
- 沒見到甜蜜,倒是這個演技每一秒都是暴擊 ------《甜蜜暴擊》
- 現在還是有這么多粗糙的偶像劇,玩了幾十年的老套橋段還在用 ------《極光之戀》
- 瞟了半集被嚇死了,演技跟癡呆似的= = ------《路跑甜心》
- 劇情奇葩,演技浮夸,特技粗糙。一劇融合了以上的所有元素,導演簡直就是演藝圈的火鍋店老板 ------《來自星星的繼承者們》
- 于媽拍的那版.....其實還挺好看的! ------《新笑傲江湖》
03演員對比
我們此次根據演員參演的劇集評分,考慮演員在其中角色的重要性進行賦權,結合劇集評論數量,加權平均得到每個演員的評分情況。首先是我們評選的評分靠前的演員及其出生年份:
估計大部分年輕的讀者,可能對這些名單中的演員很多都不是很熟悉,在此小編建議各位可以去看一下這些老戲骨的劇集,感受他們所散發的魅力。同時我們也專門對比了下80后、90后(包含00后)的評分,找尋其中的佼佼者:
劉昊然在評分中領跑其他的90后,考慮到其今年只有20歲出頭,我們也期望他在未來能給我們帶來更多經典的作品。
可能很多讀者對TOP20的演員并不是很熟悉,其實大可不必,因為下面的榜單中相信大多都會是你所熟悉的:
想必看到這里,各位會找到熟悉的感覺,我們相信榜上的各位演員其實也是***潛力的演員。只要努力雕琢演技,未來一定會受到觀眾對其演技的認可,我們同時分別對比了一下男、女演員:
在此需要指出的是,余文樂和趙又廷上榜并不是因為其劇集評分真的偏低,主要是其參與的大陸制作劇集評分較低,并且我們此次沒有統計港臺劇。我們也希望榜單中的各位演員未來更加精彩的表現。
04星座分布
感謝豆瓣給我們提供了演員星座的數據,小編周圍也有許多對星座十分感興趣的朋友,不妨我們看一下星座的分布情況:
看來星座整體分布還是比較平均的,只是天秤座和天蝎座略多于其他星座,關于星座,至于你信不信,反正小編是不怎么信的
關于矩形樹圖的實現,可以參考以下代碼:
- from pyecharts import TreeMap
- star_stat = actor_data.groupby('xingzuo').agg({'name':'count'}).reset_index().sort_values('name'
- ,ascending=False)[0:12].reset_index()
- data = [{'value':star_stat['name'][i],
- 'name':star_stat['xingzuo'][i]+' '+str(star_stat['name'][i])} for i in range(star_stat.shape[0])]
- treemap = TreeMap("星座分布圖", width=1200, height=600)
- treemap.add("星座分布", data, is_label_show=True, label_pos='inside')
- treemap.render('星座分布.html')
05城市分布
我們在看完了星座分布之后,再繼續來看一下演員的城市分布,看看有多少自己的老鄉在參演著電視劇:
不出意外,北京和上海兩大中心城市的演員數量也是最多的,而第三名就是小編的家鄉青島了。之前每當小編提及青島,總是會提起青島的明星多,這次的數據更加使得小編未來有了交流(chuixu)的底氣。
我們下面分別來看一下TOP5的各個城市明星名單:
北京
上海
青島
哈爾濱
西安