圖數據庫:釋放互聯數據的力量
原創【51CTO.com原創稿件】從Hadoop生態圈崛起開始,大數據已經熱了十多年,大數據的存儲、分析、處理等技術都已經比較成熟。發掘大數據之間的關聯,以及關聯后隱藏的商業價值,是大數據的真正意義所在,也是技術上的一大難點。
數據庫做為組織、存儲和管理數據的倉庫,是大數據的基礎和關鍵一環。數據庫咨詢公司 DB Engines 調研結果顯⽰,圖數據庫正成為所有數據庫管理系統中增長最快的⼀類。
圖數據庫更注重關系
圖數據庫,對于很多人來說還比較陌生。其實,圖數據庫是用圖來存儲數據,是最接近高性能的一種用于存儲數據的數據結構方式之一。構成一張圖的基本元素是節點(點)和關系(邊)。節點和關系都可以設置自己的屬性。節點經常被用于表示一些實體,但依賴關系也一樣可以表示實體。節點之間的關系是圖數據庫很重要的一部分。通過關系可以找到很多關聯的數據,比如節點集合、關系集合以及他們的屬性集合。
舉個例子,對于社會網絡中人與人之間的關系來說,用關系型數據庫存儲這種數據的效果并不好,其查詢復雜、緩慢、超出預期,而圖數據庫的獨特設計恰恰彌補了這個缺陷。關系是圖數據庫特有的組成部分,相對于關系數據庫中的各種關聯表,圖數據庫可以通過關系包含屬性這一功能來提供更為豐富的關系展現方式。
靈活性是推動圖數據庫流行度激增的關鍵因素。在過去10幾年的時間里,對可用性和大規模的相同需求推動了各種NoSQL產品的開發和采用,從圖數據庫近期的趨勢中看,這種走勢將繼續走強。
圖數據庫既然如此強大,但是過去并沒有被廣泛使用,主要是技術和條件上的限制:缺乏實時數據處理能力;支持的數據規模有限;計算的深度只有2-3層等。
TigerGraph公司,一個中西結合的名字,其創始人兼CEO許昱博士表示,TigerGraph的創始團隊有中國背景,Tiger代表著TigerGraph強大的數據處理能力。經過在硅谷5年的開發,TigerGraph首創了業界***的原生、分布式、并行圖數據庫。日前,許昱接受了51CTO記者的采訪,就圖數據庫進行了深入探討。
TigerGraph創始人兼CEO許昱(博士)
強大的技術實力
原生,意味著不基于一個關系型數據庫的表來存圖,也不基于一些Key-Value系統,不把數據打亂存在別的存儲系統里。TigerGraph圍繞圖做了存儲、計算引擎、查詢語言、可視化工具,所有這些都只是圍繞圖,而不基于關系型數據庫,也不基于文檔數據庫。
說到并行,并不僅僅是多機分布式。其核心在于,圖中的一個節點、一個邊都存在屬性,都是并行的存儲單元。但并行最重要的核心是計算,多核、多CPU、多線程,是并行最核心的要素。
TigerGraph 進入中國市場不久,已經收獲了金融、銀行、電力等行業的大客戶,這得益于TigerGraph強大的技術優勢。
首先,在實時計算技術方面,一般的查詢涉及到幾千萬到上億個節點和邊關聯,點是實體,邊是關系,TigerGraph的實時計算可以每秒每機遍歷數億個頂點/邊,步數可達三步或更多,比傳統⽅法快多個數量級。
第二,支持數據庫的增、刪、改、查,是業界正式商用的數據庫。每臺機器每⼩時可加載 100 到 200 GB 數據的能⼒,不再需要批量加載。
第三是超大規模,在只有20臺商⽤計算機的集群上,能夠將20億以上的每日事件實時流式傳輸到具有超過1000億個頂點和超過6000億個邊的⼤數據圖譜。TigerGraph圖數據庫已經成功地在世界上多個行業***的公司生產線上運行了多年。
此外,TigerGraph的產品化程度很高,用戶只需在TigerGraph網站上下載軟件、技術文檔,就可以自己去做圖模型、數據錄入、二次開發等,不需要TigerGraph的人員指導。
組建本地團隊:推動市場、推動生態
目前,TigerGraph在中國組建了團隊,據TigerGraph中國區總經理烏明捷介紹,中國團隊的工作主要有以下三個方面:
1、提高大眾對圖的接受度和了解度。最初,TigerGraph認為金融行業會是使用圖數據庫最多的行業,但是經過一年的市場推廣發現客戶其實來自各個行業。比如物流調度IoT,需要用圖來解決路徑規劃的問題。中國的大數據市場比較活躍,企業也愿意嘗試新技術,所以TigerGraph希望推動這個市場。
2、推動合伙伙伴生態的建設。TigerGraph不賣數據,不做具體的應用,對合作伙伴持有開放的態度,中國團隊的組建將有利于推動整個生態的發展。
3、快速響應客戶需求。當中國客戶有需求的時候,通過目前在國內的技術和咨詢團隊,可以進行快速響應。
簡而言之,推動市場、推動生態,幫助行業標桿企業,在中國投入更多的資源去加強和客戶的直接對話,是目前TigerGraph進入中國市場的主要工作。
從客戶的痛點入手
當今,很多企業往往使用若干個不同的數據庫,來解決不同部門的問題。TigerGraph進入客戶是一個順勢而為的過程,先解決別的數據庫工具不能解決的問題,和其他關系型數據庫結合在一起,構成一個成熟的、有效的分析環境。
TigerGraph憑借強大的圖數據庫,為企業提供實時分析應用程序,在反欺詐和反洗錢、消費者智能、智能供應鏈、智能電網等應用中都有著出色的表現。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】