用數據分析大家都喜歡什么類型的抖音視頻
之前有個朋友提到了抖音數據的獲取。
問我這樣的行業前景如何,說實話我哪知道啊...
不過也算是給我提供了一些分析思路,感謝。
所以本次就來分析一下抖音的那些大V們。
來探索一下什么樣的視頻在抖音里***。
這里不得不吐槽一下抖音,體驗越來越差。
從一開始的打開App沒廣告,再到現在啟動頁面有廣告,刷視頻也有廣告,還有商品櫥窗的存在。
當然這只是吐槽一下而已,其實無論什么產品,廣告必不可少~
否則,日子估摸著一天比一天難過。
或許,某一天我的公眾號也會出現廣告...
一、獲取分析
信息肯定不是去抖音獲取的,而是從某平臺爬取的。
具體的就不透露了,萬一哪天被查水表了該怎么辦。
主要包含了大V們的昵稱、性別、類型、點贊數、粉絲數以及視頻數。
一共有2840位抖音大V,粉絲數都是50w+。
二、數據可視化
01 性別分布情況
2000多位大V,除去未知性別的,男女比例基本在「1:1」。
可視化代碼如下。
- def create_gender(df):
- """
- 性別
- """
- df = df.copy()
- df.loc[df.gender == 0, 'gender'] = '未知'
- df.loc[df.gender == 1, 'gender'] = '男性'
- df.loc[df.gender == 2, 'gender'] = '女性'
- gender_message = df.groupby(['gender'])
- gender_com = gender_message['gender'].agg(['count'])
- gender_com.reset_index(inplace=True)
- # 生成餅圖
- attr = gender_com['gender']
- v1 = gender_com['count']
- pie = Pie("抖音大V性別分布情況", title_pos='center', title_top=0)
- pie.add("", attr, v1, radius=[40, 75], label_text_color=None, is_label_show=True, legend_orient="vertical", legend_pos="left", legend_top="%10")
- pie.render("抖音大V性別分布情況.html")
02 點贊數***0
點贊數都是過億的存在,就問你怕不怕。
其中「浙有正能量」和「人民日報」這兩個都是屬于弘揚中國正能量的。
泱泱大中華,復興在當下,國強則無懼,龍行在天涯。
可視化代碼如下。
- def create_likes(df):
- """
- 點贊數
- """
- df = df.sort_values('likes', ascending=False)
- attr = df['name'][0:10]
- v1 = ["{}".format(float('%.1f' % (float(i) / 100000000))) for i in df['likes'][0:10]]
- # 生成柱狀圖
- bar = Bar("抖音大V點贊數***0(億)", title_pos='center', title_top='18', width=800, height=400)
- bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False)
- bar.render("抖音大V點贊數***0.html")
03 粉絲數***0
粉絲數前十,大部分大V都是娛樂圈的。
這也是當下所流行的~
可視化代碼如下。
- def create_fans(df):
- """
- 粉絲數
- """
- df = df.sort_values('fans', ascending=False)
- attr = df['name'][0:10]
- v1 = ["{}".format(float('%.1f' % (float(i) / 10000))) for i in df['fans'][0:10]]
- # 生成柱狀圖
- bar = Bar("抖音大V粉絲數***0(萬)", title_pos='center', title_top='18', width=800, height=400)
- bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False)
- bar.render("抖音大V粉絲數***0.html")
04 各類型點贊數匯總分布圖
「藍V」「娛樂」「生活」「美女」「搞笑」「帥哥」「音樂」這些類型的抖音視頻,應該算是在抖音里較受歡迎的。
藍V是抖音上的一個認證方式,主要是針對企業。
從上面可以看出大部分是媒體這一塊,內容則主要是一些時事以及那些正能量視頻。
可視化代碼如下。
- def create_type_likes(df):
- """
- 類型點贊數
- """
- dom = []
- likes_type_message = df.groupby(['type'])
- likes_type_com = likes_type_message['likes'].agg(['sum'])
- likes_type_com.reset_index(inplace=True)
- for name, num in zip(likes_type_com['type'], likes_type_com['sum']):
- data = {}
- data['name'] = name
- data['value'] = num
- dom.append(data)
- # 生成矩形樹圖
- treemap = TreeMap("各類型抖音大V點贊數匯總圖", title_pos='center', title_top='5', width=800, height=400)
- treemap.add('各類型抖音大V點贊數匯總圖', dom, is_label_show=True, label_pos='inside', is_legend_show=False)
- treemap.render('各類型抖音大V點贊數匯總圖.html')
05 各類型粉絲數匯總分布圖
「娛樂」類型大V的粉絲數***,位居***。
其次便是「美女」「生活」「音樂」「帥哥」「文化」「藍V」類型的。
結合一下點贊數的數據,我們就能知道在抖音里什么樣的視頻大家比較喜歡。
便是「娛樂」「生活」「美女」「帥哥」「音樂」「藍V」這幾個類型。
可視化代碼如下。
- def create_type_fans(df):
- """
- 類型粉絲數
- """
- dom = []
- fans_type_message = df.groupby(['type'])
- fans_type_com = fans_type_message['fans'].agg(['sum'])
- fans_type_com.reset_index(inplace=True)
- for name, num in zip(fans_type_com['type'], fans_type_com['sum']):
- data = {}
- data['name'] = name
- data['value'] = num
- dom.append(data)
- # 生成矩形樹圖
- treemap = TreeMap("各類型抖音大V粉絲數匯總圖", title_pos='center', title_top='5', width=800, height=400)
- treemap.add('各類型抖音大V粉絲數匯總圖', dom, is_label_show=True, label_pos='inside', is_legend_show=False)
- treemap.render('各類型抖音大V粉絲數匯總圖.html')
06 視頻粉絲點贊三維度圖
視頻越多并不意味著點贊數就越多,粉絲數就越多。
不過還是會有個例出現,比如「浙有正能量」,1744個視頻,4.6億點贊數。
可視化代碼如下。
- def create_scatter(df):
- """
- 三維度散點圖
- """
- # 生成數據列表
- data = [list(i) for i in zip(df['videos'], df['fans'], df['likes'], df['name'])]
- # 生成散點圖
- x_lst = [v[0] for v in data]
- y_lst = [v[1] for v in data]
- extra_data = [v[2] for v in data]
- sc = Scatter("抖音大V視頻數粉絲數點贊數三維度", title_pos='center', title_top='5', width=800, height=400)
- sc.add("", x_lst, y_lst, extra_data=extra_data, is_visualmap=True, visual_dimension=2, visual_orient="horizontal", visual_type="size", visual_range=[0, 500000000], visual_text_color="#000", visual_range_size=[5, 30])
- sc.render('抖音大V視頻數粉絲數點贊數三維度.html')
07 平均視頻點贊數***0
***居然被一個珠寶商給霸占了,我覺得肯定有貓膩。
于是便去抖音看了一眼。
鬼知道它的粉絲和點贊數怎么來的。
或許和圈內的刪庫一樣,小哥刪視頻跑路了。
可視化代碼如下。
- def create_avg_likes(df):
- """
- 平均點贊數
- """
- df = df[df['videos'] > 0]
- df.eval('result = likes/(videos*10000)', inplace=True)
- df['result'] = df['result'].round(decimals=1)
- df = df.sort_values('result', ascending=False)
- attr = df['name'][0:10]
- v1 = df['result'][0:10]
- # 生成柱狀圖
- bar = Bar("抖音大V平均視頻點贊數***0(萬)", title_pos='center', title_top='18', width=800, height=400)
- bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False)
- bar.render("抖音大V平均視頻點贊數***0.html")
08 平均視頻粉絲數***0
妥妥的娛樂圈大佬。
反正我是一個沒關注,你們呢?
可視化代碼如下。
- def create_avg_fans(df):
- """
- 平均粉絲數
- """
- df = df[df['videos'] > 0]
- df.eval('result = fans/(videos*10000)', inplace=True)
- df['result'] = df['result'].round(decimals=1)
- df = df.sort_values('result', ascending=False)
- attr = df['name'][0:10]
- v1 = df['result'][0:10]
- # 生成柱狀圖
- bar = Bar("抖音大V平均視頻粉絲數***0(萬)", title_pos='center', title_top='18', width=800, height=400)
- bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False)
- bar.render("抖音大V平均視頻粉絲數***0.html")
三、總結
我們常說,刷抖音就是浪費時間。
講道理,抖音上也是有不少技術流的大佬,當然內容上更趨向于視頻制作。
比如下面這幾位,鼎鼎大名的「黑臉V」。
所以,抖音也并不是一無是處。
如果哪天你也能學會制作出那些吊炸天的視頻,也是一種收獲。
當然路很長,慢慢走~