今年會不會感冒?大數據告訴你!
“叮叮”手機響了,你拿起來一看,屏幕上紅色的打字閃爍著“該地區已經有35人患有流感,請謹慎前往,做好必要防護措施!”如此智能的預測可能不再是夢。想知道今年冬天會不會感冒,什么時候得感冒嗎?TwitterHealth可以告訴你!
TwitterHealth是紐約羅徹斯特大學發起的一個研究項目,可以通過分析用戶的Twitter微博內容來預測用戶會不會感冒。注意,他們僅僅分析微博內容!
這一項目原來只是給研究人員用作數據挖掘和機器學習系統用的,后來開發出了這一功能。羅徹斯特大學計算機科學系主任Henry Kautz說:“TwitterHealth是一個專門研究分析不同地理位置信息的項目,比如智能手機的GPS信息。”
Kautz說:“我們發現越來越多的社交媒體開始加入地理位置定位這一功能,人們在發Twitter微博的時候就會順帶上自己的地理位置信息。我們的研究小組就從網站上下載并研究此類信息。”
Kautz的學生建立起一個計算機網絡,專門用來下載地理位置坐標為大城市的Twitter微博。然后他們開始從海量的大數據資源中挑選可用數據。
“我們發現,人們經常在Twitter微博中提到自己的健康狀況。比如說‘我流鼻子了’、‘我感冒了’、‘我感覺不舒服’等。我們就設想,是否可以根據這些詞句來跟蹤季節性流感?”
于是研究團隊開始拙手寫機器學習算法,在幾百條實驗微博中挑選“感冒微博”。
***團隊的算法在挑選“感冒微博”時已經可以達到99%的準確率,幾乎與人腦分析文本一致,而且“感冒”分析速度要快于美國本土***的疾病控制中心。
“從大數據中,我們可以發現季節性流感的分布和傳播,我們測量和預測的精度完全不輸疾病控制中心。”Kautz說道。
TwitterHealth的極大成功也促使不少學生開始從事大數據和數據挖掘方面的創業。除了疾病傳播趨勢,他們想跟蹤更多趨勢。
Kautz說:“除了用于健康預測,還可以做更多有關商業的應用,比如說追蹤最近的時尚潮流,追蹤最火的網絡歌手、網絡段子等。”
但是Kautz還是重點提到了大數據在醫療衛生行業中的巨大潛力。“以往通過問卷收集醫療衛生數據又慢又貴。”他還提到了TwitterHealth對于抗擊抑郁和自殺有一定幫助,可以在有自殺事件發生之前就提前預警。
Kautz說道:“通過分析大數據資源,我們可以發現用戶是否會經過某一疾病多發街區,是否在流感病人吃過飯的餐館就餐,因為在這些地方都有可能會增加得流感的機會。”
Twitter 微博的內容是做大數據分析的良好數據來源,但是Facebook等社交網站可以看到更多隱私內容,但是也因為隱私設置的問題讓數據獲取成了問題。如果可以說服Facebook也使用TwitterHealth這樣的服務,或者能夠獲得Facebook用戶的狀態、文章,這樣TwitterHealth就可以服務更多人,減少疾病的發生。
TECH2IPO:這種方法完全可以移植到中國來。許多中國人都喜歡把自己的故事發到網上,比如“我今天吃了3兩飯”、“我感冒了,好孤單”、“居然懷孕了”、“LV的包包不如Gucci的好”、“一師是個好學校”、“七顆石頭換心愿”之類的內容,可以做飲食、健康、人口、消費、教育、情感類的分析,潛力還是非常大。但是也要考慮到很多虛假內容,比如說一個女孩子在別人的車中發微博說“還是凱迪拉克坐著舒服”這類的話,就會對數據分析造成很大的干擾。
文章來源:InformationWeek