成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用KNIME進(jìn)行情感分析 | 上

大數(shù)據(jù) 數(shù)據(jù)分析
本文案例展示了如何利用KNIME對(duì)社交媒體數(shù)據(jù)進(jìn)行情感分析。

這個(gè)案例展示了如何利用KNIME對(duì)社交媒體數(shù)據(jù)進(jìn)行情感分析。

[[178259]]

案例中的數(shù)據(jù)抓取的是Slashdot網(wǎng)站首頁內(nèi)容,由FundaciónBarcelona Media4提供。Slashdot是1997年成立一家非常受歡迎的科技新聞?wù)尽lashdot網(wǎng)站首頁的主要內(nèi)容就是網(wǎng)友發(fā)布的新聞以及網(wǎng)友在評(píng)論區(qū)展開的討論。案例使用的數(shù)據(jù)共包含約41337條評(píng)論,這些評(píng)論主要是11000多名Slashdot用戶對(duì)163篇政治報(bào)道的討論。

用KNIME進(jìn)行情感分析 | 上
圖1

研究思路

我們的研究目的是區(qū)分不同用戶的情感取向。我們將通過對(duì)用戶撰寫的評(píng)論和文章的詞語進(jìn)行分析、做出用戶情感取向判斷。也就是說,我們通過測量用戶(非匿名)撰寫的評(píng)論和文章時(shí)使用的正面的情感、態(tài)度、觀點(diǎn)詞匯的數(shù)量以及負(fù)面情感、態(tài)度和觀點(diǎn)詞匯的數(shù)量,來判定該用戶情感取向。用戶使用正面詞匯越多,其情感取向偏向正面,反之亦然。

此處涉及到標(biāo)記詞匯極性的問題,在這里我們使用MPQA主觀詞庫來標(biāo)記詞匯的極性。MPQA是一個(gè)公開的詞庫,其中包含了關(guān)于詞匯極性的數(shù)據(jù)。

研究流程

用KNIME進(jìn)行情感分析 | 上
圖2

首先讀取從Slashot上獲取的數(shù)據(jù),選取報(bào)道主題為“interviews”的評(píng)論,刪除匿名文章和匿名評(píng)論。然后將剩下的非匿名評(píng)論轉(zhuǎn)化為文檔方便之后的分析。與此同時(shí),另外一邊首先讀取MPQA主觀詞匯,提取出詞匯和極性,并且拆分為正面詞匯和負(fù)面詞庫方便之后的標(biāo)記。***,DictionaryTagger節(jié)點(diǎn)將每個(gè)情感標(biāo)記到評(píng)論中每個(gè)詞語上。

用KNIME進(jìn)行情感分析 | 上
圖3

現(xiàn)在所有評(píng)論中的詞匯都被標(biāo)記成了正面或負(fù)面,我們就可以開始計(jì)算工作。我們要計(jì)算每個(gè)評(píng)論中的正面或負(fù)面詞匯數(shù)量和每個(gè)用戶共使用的正面或負(fù)面詞匯數(shù)量。通過user id我們可以整合每個(gè)用戶不同評(píng)論中的正面詞匯和負(fù)面詞匯。在流程圖中對(duì)應(yīng)的是Documentscoring和User scoring。***,我們?yōu)椴煌楦腥∠虻挠脩魳?biāo)注顏色,整理數(shù)據(jù)并制成散點(diǎn)圖。

結(jié)果展示

下圖是用戶使用詞匯的散點(diǎn)圖,縱坐標(biāo)是正面詞匯,橫坐標(biāo)是負(fù)面詞匯。綠色的用戶情感取向正面;灰色代表用戶情感取向既不是正面,也不是負(fù)面;紅色代表情感取向負(fù)面。

用KNIME進(jìn)行情感分析 | 上
圖4

左上角紅箭頭指的用戶是Duc Ruby,他是情感取向最正面的用戶,也是經(jīng)常在Slashdot上發(fā)表評(píng)論的用戶。他使用的正面詞匯數(shù)量是51,負(fù)面詞匯數(shù)量是10,我們用正面詞匯數(shù)量減去負(fù)面詞匯數(shù)量得出其情感指數(shù)是40,即情感取向最正面的用戶。

右下角紅箭頭指的用戶是whytakemine,他是情感取向最負(fù)面的用戶,也是經(jīng)常在Slashdot上發(fā)表評(píng)論的用戶。他使用的正面詞匯數(shù)量是16,負(fù)面詞匯數(shù)量是25,我們用正面詞匯數(shù)量減去負(fù)面詞匯數(shù)量得出其情感指數(shù)是-9,即情感取向最負(fù)面的用戶。

左下角圓圈部分代表了大部分中立用戶,他們?cè)赟lashdot上發(fā)表的評(píng)論很少,這也是無法判斷其情感取向的可能原因。

總體而言,本次案例介紹的是如何利用社交媒體UGC內(nèi)容對(duì)用戶進(jìn)行情感分析。其實(shí),情感分析只是對(duì)用戶進(jìn)行了歸類,它主要還是用于后續(xù)的其他研究,如結(jié)合社會(huì)網(wǎng)絡(luò),對(duì)其中的Leader和Follower做進(jìn)一步分析。

點(diǎn)擊查看:
用KNIME進(jìn)行情感分析 | 中

用KNIME進(jìn)行情感分析 | 下

責(zé)任編輯:未麗燕 來源: 36大數(shù)據(jù)
相關(guān)推薦

2016-12-07 14:56:51

KNIME數(shù)據(jù)分析

2016-12-07 14:45:25

KNIME情感分析數(shù)據(jù)分析

2018-09-04 11:45:31

前端JavaScriptNodeJS

2018-01-04 13:07:43

Python機(jī)器學(xué)習(xí)情感分析

2017-10-10 13:13:48

2016-12-07 09:27:11

KNIME大數(shù)據(jù)網(wǎng)絡(luò)

2016-12-22 10:00:18

KNIME流失模型

2019-05-14 10:37:26

Python機(jī)器學(xué)習(xí)編程語言

2016-11-16 15:05:42

情感分析

2023-02-03 11:40:49

機(jī)器學(xué)習(xí)分析情感

2020-07-23 09:15:25

Python機(jī)器學(xué)習(xí)聚類分析

2011-04-14 09:05:07

ExcelMySQL數(shù)據(jù)

2020-12-15 20:00:09

比特幣加密貨幣區(qū)塊鏈

2017-10-10 15:42:56

Python鹿晗關(guān)曉彤

2023-05-09 12:40:40

數(shù)據(jù)分析Cars24Pandas

2010-05-17 16:25:05

MySQL數(shù)據(jù)

2011-04-06 11:36:28

MRTG流量

2022-12-27 08:00:00

開發(fā)機(jī)器學(xué)習(xí)數(shù)據(jù)集

2017-05-15 14:00:28

大數(shù)據(jù)Python情感極性分析

2017-03-21 10:55:22

大數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产电影一区二区在线观看 | 亚洲视频在线观看 | 91免费版在线观看 | 国产黄色一级电影 | 欧美黄页| 欧美一级在线 | 视频在线一区二区 | 涩涩导航 | 成人av在线播放 | 九九视频在线观看 | 亚洲综合一区二区三区 | 国产精品久久欧美久久一区 | 性高湖久久久久久久久aaaaa | 一区二区三区国产视频 | 日本三级全黄三级三级三级口周 | 99re在线免费视频 | h视频免费在线观看 | 91动漫在线观看 | 亚洲激情在线观看 | 婷婷综合色 | 夜夜夜久久久 | 亚洲精品久久久久久久不卡四虎 | 国产国产精品久久久久 | 日韩欧美在线一区二区 | 亚洲欧洲视频 | 亚洲成人一级 | 毛片a级 | 久久人人爽人人爽人人片av免费 | 欧美在线一区二区三区 | 久久久美女 | 日本精品一区二区 | 一区二区激情 | 欧美日日日日bbbbb视频 | 亚洲黄色一级毛片 | 国产在线精品一区二区三区 | 国内毛片毛片毛片毛片 | 欧美二区三区 | 在线播放一区二区三区 | 精品国产一区二区在线 | 成人午夜免费视频 | 成人国产网站 |