Twitter將向科學家開放全部數據
新浪科技訊 北京時間5月27日上午消息,每天有5億條Twitter消息發布,內容涉及人們生活的方方面面,而現在,這家社交網絡決定將這一巨大的數據寶庫向科學家開放,幫助他們研究人類的行為模式、預判健康風險并追蹤傳染病的傳播情況。
例如,微軟研究人員通過對Twitter上的懷孕婦女透露出的情緒,開發了一種新的算法來預測產后抑郁癥的風險。美國地質調查局則可以使用Twitter追蹤地震發生地。
直到目前,多數對相關問題感興趣的科學家都只能使用有限的Twitter消息。盡管多數Twitter消息都對外公開,但科學家卻希望能夠隨意搜索這些內容,他們目前只能通過Twitter的API(應用編程接口)實現這項功能,但卻只能訪問1%的數據。
不過,這種情況很快就將改變:Twitter今年2月宣布,將把2006年以來的所有數據免費提供給研究人員,有望使得Twitter成為一項廣受歡迎的研究工具。借助如此龐大的數據,科學家可以展開更加復雜的研究,回答更具體的問題。
Twitter的這一計劃令人興奮,但也引發了一些問題。Twitter能否對相關科研結果享有任何權益?由于用戶未必想將自己的內容貢獻給研究人員,因此Twitter的這一工具是否有違道德?
為了解決這個問題,弗吉尼亞理工大學計算機流行病學家凱特琳·里夫斯(Caitlin Rivers)和布萊恩·劉易斯(Bryan Lewis)今年2月針對Twitter數據的使用方式發布了道德規范。他們建議科學家不要披露相關用戶的名稱,也不要公布研究目的。
例如,盡管從公共空間搜集信息并不違反道德,而Twitter也的確是一個公共空間,但在未經他人許可的情況下分享其身份信息卻有違道德。里夫斯和劉易斯認為,科學家需要將保護用戶隱私列為Twitter研究項目的基本原則——數據越大,責任越大。