微軟發布新的Hadoop Azure大數據分析服務
就像微軟把Excel表單處理引進到商務領域一樣,微軟希望其推出的新的Windows Azure HDInsight服務能夠利用大數據分析帶來同樣的影響力。
微軟數據平臺事業部總經理Eron Kelly表示:“我認為,我們一直做的很好的事情是解決困難的技術問題并且簡化這些問題。因此,我們正在使Hadoop更簡單并且把它提供給每一個人。”
Windows Azure HDInsight是作為Windows Azure平臺服務提供的。這項服務提供一個Apache Hadoop數據處理平臺和相關的工具。HDInsight將使用Hortonworks提供的Hadoop旗艦發布版Hortonworks數據平臺(HDP)。
微軟不是唯一的提供Hadoop云服務的公司。亞馬遜Web服務提供Hadoop和Rackspace計劃,并且將很快推出HDP服務。IBM的SoftLayer主機服務本周也宣布,它將很快提供在多臺裸機服務器上快速處理Cloudera的Hadoop發布版的能力。
但是,微軟希望通過簡化這個部署流程然后再使用Hadoop獲得日益增長大數據分析領域的競爭優勢。
例如,這項服務兼容微軟數據分析工具。Excel表單用戶能夠應用這個表單的一個名為“Power BI”的商務智能功能吸收、分析和可視化由Hadoop MapReduce提供的數據。
微軟第一次宣布這項服務的計劃是在2011年。微軟原來打算與Hortonworks合作開發自己版本的Hadoop。微軟計劃讓自己版本的Hadoop經過設置之后能夠在Windows服務器上運行。
微軟已經向開源軟件項目Apache Hadoop和相關的軟件貢獻了1.6萬行代碼。
Windows Azure HDInsight將在一個stock version HDP上運行,允許用戶在Azure和其它非Azure HDP部署之間遷移工作量。在Hortonworks發布其下一個版本的HDO之后,2.0版將在下個月推出。Azure的HDP版將自動升級。
微軟實際上已經為一些選擇的客戶以全生產模式運行了兩個月的Windows Azure HDInsight服務。
巴塞羅納市已經使用這項服務分析交通模式、垃圾收集和有關其它城市任務的數據,希望這種數據用于做出更明智的開支決策。
弗吉尼亞理工學院和州立大學的一群研究人員正在使用這個服務運行基因測序工具。
微軟負責數據平臺事業部的副總裁Quentin Clark本周將在紐約舉行的“O'Reilly's Strata and Hadoop World”大會上更多地介紹Windows Azure HDInsight服務的情況。