海量數(shù)據(jù)應(yīng)用!微軟Azure推開源HDInsight
近日,微軟正式發(fā)布Windows Azure HDInsight,這是微軟Azure云端的Apache Hadoop版本,針對(duì)海量數(shù)據(jù)應(yīng)用。
Hadoop為開源的軟件架構(gòu)平臺(tái),可用來存儲(chǔ)與處理集群服務(wù)器上的大量數(shù)據(jù),并已成為管理海量數(shù)據(jù)的***平臺(tái)。包括Google、Yahoo、Facebook、Amazon、IBM及英特爾等業(yè)者都使用Hadoop架構(gòu)來執(zhí)行大量的分布式計(jì)算。
微軟表示,HDInsight是以Hadoop開源為基礎(chǔ)提供Azure的云端服務(wù),已公開預(yù)覽多時(shí),獲得客戶的支持并成為微軟企業(yè)服務(wù)的一部份。
Windows Azure HDInsight平臺(tái)
Windows Azure HDInsight采用了Hadoop的數(shù)據(jù)處理平臺(tái)與相關(guān)的工具,以及知名的Hadoop版本─Hortonworks Data Platform(HDP),同時(shí)兼容微軟的各種分析工具,包括Excel與Power BI等,并支持.NET或Java等編程語言,以更好的面對(duì)使用Hadoop的客戶。
微軟指出,HDInsight為海量數(shù)據(jù)的端對(duì)端解決方案,針對(duì)用戶可從各種方面獲取的數(shù)據(jù)以供Excel使用,涵蓋SQL Server、HDInsight、Hadoop的外部叢集或是公開的數(shù)據(jù)集等,并利用Power BI中的工具來萃取數(shù)據(jù)文件。
據(jù)了解,微軟準(zhǔn)備在下個(gè)月正式發(fā)表HDP 2.0 for Windows Server版本,未來準(zhǔn)備將HDInsight更新至HDP 2.0。