Facebook開放圖譜:如何從9億用戶數據里找猛料
Facebook 平臺有6年歷史了,公司借用它的開放圖譜正在不斷擴張,如今有900萬個應用借助這個開放圖譜在社交網絡平臺上分一杯羹,而最近Viddy、SocialCam、VEVO等借助開放圖譜獲得大量用戶,也說明了開放圖譜的價值。
開放圖譜介紹:
1. 本質上,開放圖譜是一種方式,它抓取Facebook用戶在第三方服務上的數據,然后反饋給Facebook 機器。這樣它就可以向所有在線的朋友分享全部的信息。比如數字音樂服務Spotify, 你跟你Facebook的朋友分享你喜歡的Spotify音樂,這些小碎片全部匯集到Facebook動態更新, 然后到Facebook時間線,最后這個碎片會影響你的其它Facebook朋友。
Facebook超過9億用戶每天都會產生大量數據,但Facebook不能把所有的信息碎片顯示在你的新聞動態中,開放圖譜讓應用和網站開發者構建他們的數據,這樣Facebook機器可以重新分類并有目的性的利用這些數據。
2. Facebook的開放圖譜總負責人Mike Vernal表示:“我們可以借助傳統的文本分析來得出結果, 但最后還是決定建立一個構架:開發者能夠明確告訴我們他應用的相關信息,這樣方便我們快速提煉出更有趣,更直觀的信息。”
應用開發者在自己的網站上構建數據庫,Facebook就在開放圖譜上構建這些應用。前Myspace母公司Fox Interactive員工Adrian Aoun認為:“Facebook之所以能打敗Myspace, 就是因為它能夠有效地管理數據,而且條理清楚。”

在開放圖譜怎樣甄選數據:
Facebook儲存著兩種數據:目標數據和描述目標數據關系的數據;
1. “在系統的頂層我們支持開發者定義他們的目標數據,然后像整理一般用戶信息一樣對開發者目標數據進行歸類。”
系統主要從兩部分工作:1. 分析什么內容能讓Facebook聽眾感興趣。2. 基于第一個分析出的結果分析什么內容對你是特別重要的。然后我們匯總這兩個分析,決定新聞動態系顯示什么,時間線顯示什么,其他相關的系統顯示什么。
2. “在網頁上,我們試圖分析你在尋找什么, 比如Obama有3000萬粉絲, 如果你訪問他的主頁,我們會提示你的哪些朋友也喜歡他,我們做這個只需要幾毫秒。”
當用戶在Facebook上這里點擊,那里點擊的時候, 軟件平臺Scribe正在實時記錄這些數據,另外一個接入Scrible的平臺正在進行實時分析,得出什么是最受歡迎的,什么是最不受歡迎的。這些記錄會被儲存在另一個數據庫里,然后顯示在新聞動態,時間線里。Vernal 表示,數據從一個系統移到另一個系統耗時20-30秒,每個小時有數億的轉移行為在發生。所以才保證了Facebook這個開放圖譜的高速運行。
【編輯推薦】