Cloudera發(fā)布面向”普通人”的Hadoop云計(jì)算服務(wù)
硅谷企業(yè)Cloudera日前發(fā)布了一款免費(fèi)的,基于Linux軟件環(huán)境下的個(gè)人用面向云計(jì)算的分布式軟件,該軟件降低了對(duì)使用人員的要求,使“普通開發(fā)者”也可用該軟件搭建云計(jì)算平臺(tái),處理海量數(shù)據(jù)。
“Hadoop提供了無可匹敵的收集、存儲(chǔ)和分析數(shù)據(jù)的功能,但是直到現(xiàn)在,有一些企業(yè)還是回避它,”Burlingameg公司的創(chuàng)建人之一Jeff Hammerbacher,在與Betanews的一場(chǎng)新聞發(fā)布會(huì)上說。
“以前,擁有博士學(xué)位背景的人才能使用Hadoop。但是例如醫(yī)院和銀行這樣的機(jī)構(gòu),并沒有這樣的人員。 Hadoop的配置和管理的確很讓人痛苦。但是現(xiàn)在我們提供了更容易的可以讓“普通人”使用的Hadoop,”Hammerbacher說,他曾經(jīng)在 Facebook創(chuàng)建并領(lǐng)導(dǎo)了一個(gè)Hadoop數(shù)據(jù)工作組。
Facebook、Google和Yahoo這樣的網(wǎng)站,最初開發(fā)Hadoop的目的是,通過數(shù)以千記的計(jì)算機(jī)將文本和日志數(shù)據(jù)集中在一起,將數(shù)據(jù)放在他們的網(wǎng)站上,觀察用戶的使用習(xí)慣,Hammer如是說。但是所有處理萬(wàn)億字節(jié)非結(jié)構(gòu)化的信息的公司,也必將在更多的領(lǐng)域使用Hadoop。
例如,一個(gè)早期的顧客,現(xiàn)在使用新版的Hadoop Cloudera Distribution分析基因序列,也用于做簡(jiǎn)報(bào)用。另一個(gè)公司的共同創(chuàng)辦人,Cisciglia曾經(jīng)在Google倡議并與國(guó)家科學(xué)基金(NSF)合作開發(fā)Google主辦的Hadoop簇集,用于科研和教育。
根據(jù)Hammerbacher的說法,Cloudera計(jì)劃從圍繞軟件的服務(wù)和支持獲利,而不是軟件本身。“紅帽對(duì)Linux所做的,正是我們對(duì)Hadoop所做的。”Hammerbacher如是說。
Cloudera正在分發(fā)軟件的RPM,這對(duì)大多數(shù)Linux管理員和開發(fā)人原來說再熟悉不過了,還有在Apache軟件許可下的Amazon EC2許可,Bisciglia介紹說。
該軟件的主要組成部分包括Hadoop 分布式文件系統(tǒng),一個(gè)容錯(cuò)文件系統(tǒng)用于處理商品硬件出現(xiàn)的錯(cuò)誤;一個(gè)數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施叫做Hive;以及一個(gè)MapReduce軟件的執(zhí)行,用于將應(yīng)用程序分解成一些小的工作組,并在大型主機(jī)上自動(dòng)并行執(zhí)行。
為了使Hadoop distribution的安裝和配置更容易,Cloudera建立了一個(gè)新的門戶網(wǎng)站,也是免費(fèi)的,叫做my.cloudera.com,在這個(gè)網(wǎng)站上,大家可以使用一個(gè)基于網(wǎng)絡(luò)的配置工具生成客戶軟件包,并可優(yōu)化符合他們的特殊需求。用戶也可設(shè)置保存簇集信息的設(shè)置以便自動(dòng)更新。
Cloudera提供了同樣免費(fèi)的關(guān)于軟件的基礎(chǔ)培訓(xùn),并提供了可下載的VMware圖像測(cè)試軟件在Linux,Windows或Macintosh平臺(tái)上的效果。
公司的其他共同創(chuàng)建人包括甲骨文公司的前副總裁mike Olson ,以及Yahoo的前總工程師Amr Awadallah博士。
【編輯推薦】