探秘基于“內存云”的微軟圖形數據庫Trinity
譯文【51CTO 3月8日外電頭條】微軟數年之前就拋出了代號為Trinity的圖形數據庫研究項目,但從那以來我就沒聽到過任何跟進信息。恰逢TechFest研究展會開幕之際,對于該項目頗為關注的我們自然不能放過這個好機會。
一位讀者朋友(特此鳴謝Gregg Le Blanc)發給我一條鏈接—— 一個代號為Trinity的微軟研究報告 。用官方的話來說,這是一款“圖形數據庫及計算平臺”。
由于本周是微軟TechFest內部研究展會向員工開放的時段(而三月六號微軟則允許指定媒體及嘉賓參與展會參觀),因此我們一定得把握好這個時機,對該研究項目一探究竟。
以下是微軟對代碼Trinity的研究項目給出的說明:
“ Trinity是一款圖形數據庫及圖形化計算平臺 ,以分布式內存云為設施基礎。Trinity項目的核心是以內存為基礎的分布式鍵值存儲機制,而完全以內存搭建的鍵值存儲體系使得Trinity能夠為隨機數據訪問提供高速響應。這一特色使得Trinity在處理大規模圖形化任務時具有其它項目難以企及的天然優勢。Trinity是一款立足于數據管理層視角的圖形類數據庫,并在圖形分析領域扮演著并行圖形計算平臺的角色。作為一款數據庫,它具備包括數據檢索、并行查詢處理、并行控制等諸多功能。而作為一款計算平臺,它又能夠為大型圖形提供以頂點為基礎的并行圖形計算能力。”
以下是該項目的基本構架圖:
Trinity立足于分布式內存存儲層之上,也就是所謂“內存云”。Trinity所提供的實用工具包括一款“高速十億級圖形節點生成器”、Trinity Shell以及一系列其它管理工具。
根據Trinity官方報告的說法,Trinity項目的代碼目前只能通過微軟企業內部網獲取。這樣一個還未徹底公布的項目到底有什么吸引力呢?
首先,Trinity可以幫助我們完成網絡搜索工作。Trinity應用程序報告展示了這樣一個例子,在Facebook這樣的“網絡級社交站點”中搜索相關信息。微軟的Bing搜索引擎能夠檢索用戶的Facebook網絡,以找出與搜索對象相關的提示信息,但這一過程工作量無疑是巨大的,同時又要求迅速反饋出結果。
在展示過程中,工作人員以某個擁有130位好友的Facebook賬戶為例,結果在Trinity的強大處理能力之下,兩段式查詢的執行時間被控制在10毫秒以內。研究人員表示,三段式查詢也只需要耗時100毫秒左右。
Trinity應用程序的另一大亮點則是Probase——另一個微軟研究項目,其設計目的在于改善設備與人類直接溝通的能力。Probase的***發布版于2011年5月開放下載,而Trinity正是為Probase提供知識儲備的底層基礎設施。
Trinity上手指南0.06版 已經于2012年1月開放下載,而且我剛剛聽說,原來從2011年8月開始,Trinity的Hanselminutes播客 也已經上線了。感興趣的朋友不妨以后多多關注。
鑒于微軟對大數據及相關分析業務的日益關注,像Trinity這樣的項目似乎很可能成為微軟產品陣營中又一個影響深遠的分支。
【編輯推薦】