大數據應用開發的12個輔助開發工具
在大數據應用的開發中, 除了基礎的Hadoop或者R語言之外,還有很多優秀的輔助開發工具, 能使開發者如虎添翼。
就像當年的舊金山淘金熱時, ***掙錢的除了淘金者, 還有Levi’s這樣的做牛仔褲的和那些給淘金這賣水的人,在現在的大數據淘金熱里, 也出現了很多提供開發工具或者開發環境的公司。 下面介紹12個公司和他們的工具, 無論你是從事大數據應用的開發,還是希望分析你的移動應用,這些工具都可以幫助你更好的淘金。
1) BitDeli
BitDeli是一家剛剛成立的公司, 他的產品就是可以讓開發者利用Python腳本, 對應用進行分析。 Python腳本可以很簡單, 也可以很復雜。 一切可以由開發者來定制。 BitDeli的產品甚至包含了一些機器學習的模塊。相比較龐大的Hadoop分析工具, BitDeli把自己比作是應用分析方面的RoR (Ruby on Rail)。

2) Continuity
Continuity的兩個創始人是雅虎的前***云架構師Todd Papaioannou和前Facebook的HiBase工程師 Jonathan Gray。 他們的目的, 就是想使客戶能夠像雅虎和Facebook
利用大數據。 Continuity的產品App Fabric主要是把復雜的與Hadoop和HBase集群的工作作為一個抽象層, 提供各種大數據開發工具, 來滿足企業內部或外部數據需求。

3) Flurry
Flurry是個一站式的移動應用商店, 它每年已經有100美元的營收了。 它不但幫助開發者在它的平臺上開發,還可以幫助開發者通過運營數據, 對應用進行分析以改善應用。 而且, Flurry平臺還可以和廣告網絡相對接, 幫助開發者更好的實現盈利。

4) Google Predictive API
在Google提供的眾多開發工具中, Google Predictive API 是最酷的一個了。如果你有好的訓練樣本數據, 那么Google Predictive API將會利用機器學習算法來為你的應用建立模型,并把這些模型整合到你的應用中去。 在Google給出的例程里, 包括了反垃圾郵件, 推薦引擎, 以及情緒分析等模型的搭建步驟和代碼。

5) Infochimps
盡管Infochimps把自己定義為面向企業的IT平臺, 他們大數據平臺對開發者來說也非常有幫助。它的技術平臺叫做Wukong(悟空), 用來進行大數據環境的配置和管理。 從起一個Hadoop進程到用Ruby腳本來傳遞數據流。 Wukong都可以讓開發者的工作變得更簡單。 此外, Infochimps的平臺還包括了一個數據市場,以API或者下載方式提供各類數據。

6) Keen IO
Keen IO是個強大的移動應用分析工具。 開發者只需要簡單到一行代碼, 就可以跟蹤他們想要的關于他們應用的任何信息。開發者接下來只需要做一些Dashboard或者查詢的工作就可以了。

7)Kontagent
Kontagent是一個移動, 社交, 網站應用的分析平臺。 它基于Hadoop大數據平臺而建。 今年, Kontagent平臺增添了新功能。 它可以讓用戶直接采用Hive查詢語言對數據進行任意查詢和分析,而不像原來那樣只能進行預定義的查詢和分析

8) Mortar Data
Mortar Data是專為開發者打造的Hadoop開發平臺,它用Pig 和Python的組合替代了MapReduce以便開發者能簡單地編寫Hadoop管道(Pipeline)。 今年11月, 它推出了Mortar Data開源開發框架, 利用開源社區來推動數據共享。 Mortar Data平臺運行在亞馬遜的云平臺上。 支持亞馬遜S3 以及MangoDB。 #p#
9) Placed Analytics
利用腳本語言以及API, Placed Analytics能夠提供針對移動和網絡應用的詳細用戶行為分析。包括, 用戶使用時間和地理位置信息。 這些可以幫助開發者的應用更好地吸引廣告商, 也可以幫助開發者對自己的應用進行改善。

10) Precog
Precog提供的是一個基于開源查詢語言Quirrel的交互式開發環境, 名為Labcoat。可以幫助開發者進行應用分析的開發。 這個IDE環境還提供了關于Quirrel的教程,以及其他一些復雜的函數。 用公司***運營官Jeff Carr的話來說:“就算是一個非技術人員, 幾個小時也能掌握基本功能。” #p#
11) Spring For Apache Hadoop
盡管Hadoop是用Java寫的, 但是這并不意味著, 在Hadoop上編程或者使用Hadoop對Java程序員來說就很簡單。因此, 在2012年初, SpringSource宣布推出了Spring For Apache Hadoop項目。 把Spring開發框架和Hadoop結合起來。 這樣也便于其他的Spring應用或者基于Java虛擬機的腳本, 更好地和Hadoop以及利用Hadoop的其他技術如Hive或者HBase進行整合。
12) StatMix
和BitDeli以及Keen IO一樣, StatMix也希望能夠使開發者用他們所熟知的語言來進行數據查詢與分析。 因此, 出來提供預定義的查詢之外, StatMix也提供API和代碼庫來讓開發者定制化的查詢。 并可以把不同數據源的查詢結果整合在一個定制的Dashboard里。

原文鏈接:http://www.ctocio.com/ccnews/10394.html