張華平:微博的大數據分析
2013年4月26日-27日,由51CTO傳媒集團旗下WOT(World Of Tech)品牌主辦的2013大數據全球技術峰會在北京富力萬麗酒店召開。本次峰會將圍繞大數據基礎架構與上層應用的生態系統,解決大規模數據引發的問題,探索大數據基礎的解決方案,激發數據挖掘帶來的競爭力,讓數據發出聲音。51CTO作為本次峰會的主辦方,將全程視頻、圖文直播報道這場數據的盛宴,更多內容請點擊專題:2013大數據全球技術峰會。
在4月27日的互聯網與大數據專場論壇中,北理工網絡搜索挖掘與安全實驗室主任張華平先生表了主題為“微博特征與行為的大數據挖掘分析”的演講。
張華平首先做了一段基本經歷的描述,然后講述了隨著社交網絡的飛速發展,社交網絡大數據對人們生活的影響以及大數據的實際作用。張華平通過“見微”、“知著”、“曉意”三個層面舉出了人們對于“大數據”的片面的理解,并表達了自己對于“大數據”的觀點。
他指出社交網絡對人們的生活的影響,其中包括授課、購物等等各個方面。
然后張華平又談到了他之前做過的對于新浪微博做過的具體的數據的調查。當談到了微博數據的獲取,張華平稱4億微博用戶只有5%的用戶資料為有價值資料,并且分析了這些用戶中不同類型的用戶的不同的價值。然后分析了不同地區的微博用戶數量,其中各地區微博用戶數量與當地GDP的增長有正比關系。并逐步分析了微博的發布規律、粉絲規律、關注數規律等等。
通過一種影響力計算算法,并羅列了性別、是否加V認證等具體數據,對不同類型用戶的影響力進行了分析。
然后又對許多具體的方面進行了詳盡的分析,其中包括自我介紹文本挖掘,微博個性行為與建模 ,微博個性分析的交叉原理,微博博主的個性化分析,以及他對自己的微博個性化分析,原創與轉發的不同 ,張華平通過各種各樣的具體用戶數據分析,點透了大數據時代的點點滴滴,話題與情感,微博話題跟蹤,明碼暗語”識別,微博博主情緒感知。
張衛平演講期間詼諧幽默,內容通俗易懂,很大程度上調動了現場觀眾的情緒,獲得了觀眾很高的反響。
以上是51CTO.com記者從一線為您帶來的精彩報道。后續我們還有更加精彩的獨家報道,敬請關注。