Pivotal推出大數據軟件組合
由EMC和VMware共同出資創辦的Pivotal公司已經做好了發布其BI(商業智能) PaaS(平臺即服務)的準備。與此同時,這家新公司正在致力于創建自己的數據挖掘與分析軟件產品組合。目前,Pivotal已經公布了兩個可以幫助進行數據分析的項目。其中一個是可與Hadoop數據處理平臺協作,用于實時分析的內存數據存儲;另一個是用于商業分析的數據發現工具。
作為Hadoop發行版升級的一部分,Pivotal將在新的Pivotal HD 1.1產品中納入GemFire HD。GemFire HD是一款VMware在2010年收購的內存交易存儲。由于將GemFire作為其Hadoop套裝軟件包中的一部分,Pivota希望企業以該軟件為基礎,創建使用Hadoop作為長期存儲的OLTP(聯機事務處理)系統。
Pivotal 首席產品經理Abhishek Kashyap稱,這一解決方案將使得企業能夠分析由GemFire所采集到的當前數據,以及被轉移至Hadoop的舊有交易數據。GemFire實例將被完全存儲在服務器的工作內存當中,并且能夠迅速地通過SQL查詢實時操作數據,這對于態勢感知和其他類型的實時分析都非常有用。
此外,Pivotal還發布了Pivotal Data Dispatch。該工具可以幫助數據分析工作者找到和準備用于分析的數據集。Data Dispatch工具最早由紐約證券交易所開發。數據分析師從2007年開始使用該軟件,以便更好地理解相關的法規要求所產生的影響。該軟件允許分析師挑選、過濾和綜合他們需要進行分析的來自不同來源的數據集。
Pivotal產品營銷副總裁Todd Paoletti表示,由分析師生成的數據集將被存儲在甲骨文、IBM和SAP等公司的BI工具可以使用的“沙盒”中。以往在使用傳統BI工具時,數據分析師通常必須要請求IT員工將數據集綜合起來,并將它們部署到數據倉庫中。Paoletti稱,Pivotal Data Dispatch消除了數據分析師在生成每一個新數據集時需與IT部門協商的必要。
作為一款自助式BI工具,Pivotal Data Dispatch能夠提供易于使用的圖形數據庫,方便數據分析師的使用。數據分析師還可以獲得由系統管理員首先定義和標記的數據來源。源數據文件可以是數據庫文件、直接文件、Hadoop文件、微軟項目文件或是其他常用的格式。生成的綜合性數據集可以被存儲在Hadoop或是Pivotal的Greenplum之中。