王堅:阿里巴巴為什么“去IOE”
從“商業軟件”、“開源軟件”最終演變自主技術和云計算服務能力,阿里巴巴的IT后臺在發生著怎樣的變化。
過去的一年間,高調的阿里巴巴賺足了眼球。
從“雙十一”191億元的巨額交易額,到閃電般地拆分成七家公司、25個分支機構,再到在金融業的肆意擴張,和移動互聯網領域的大舉收購……馬云構建的阿里生態圈,正在從城邦成長為“帝國”。
事實上,在阿里巴巴從城邦到“帝國”的這一系列高調動作的背后,實則都與一位低調的人有關,他就是王堅。
2008年,王堅加盟阿里巴巴成為集團首席架構師,即現在的首席技術官。這位前微軟亞洲研究院常務副院長被馬云定位為:將幫助阿里巴巴集團建立世界級的技術團隊,并負責集團技術架構以及基礎技術平臺搭建。
在加入阿里后,帶著技術基因和學者風范的王堅就在阿里巴巴集團提出了被稱為“去IOE”(在IT建設過程中,去除IBM小型機、Oracle數據庫及EMC存儲設備)的想法,并開始把云計算的本質,植入阿里IT基因。
這些工作將阿里IT發展策略從依賴“商業軟件”、到擁抱“開源軟件”最終演變為擁有強大的自主技術和云計算服務能力,更為2009年“阿里云計算有限公司”的成立埋下伏筆。2011年7月28日,阿里云自主研發的“飛天“云計算平臺開始以公共云計算服務的方式對外提供云計算商業服務。靈活的IT支撐起阿里集團的業務閃變,并在淘寶、支付寶等核心業務之外,勾勒出了新的極具潛力的盈利模式——云服務。
2012年10月,阿里云開發者大會上,王堅曾宣稱:“阿里云能在24個月內實現收支平衡。”10個月過去了,在接受《商業價值》采訪時,他依然堅持這句承諾。作為阿里巴巴在IT領域的觸角,“阿里云”的未來充滿了想象。
與此同時,王堅最初提出的“去IOE”的想法,一天都沒有停止過。甚至,阿里巴巴的“去IOE”運動引發了大型企業IT底層建設的新思潮,也使IBM、Oracle等國外大型廠商在中國倍感轉型壓力。
“平臺、金融和數據”是馬云承諾阿里集團的三大業務,阿里集團的IT格局支撐起這三大業務的發展;“阿里云”則成為阿里巴巴延伸向更多中小企業的重要IT觸手。帶著對阿里巴巴IT布局的探究,《商業價值》出版人劉湘明在杭州阿里云總部與阿里巴巴首席技術官、阿里云總裁王堅展開對話,ITValue將以連載的形式通過四篇文章完整展現。
【連載一】
王堅:我為什么反對有些企業的“去IOE”運動?
在阿里巴巴首席技術官、阿里云總裁王堅的辦公室有一面墻擺滿了書,《豐乳肥臀》、《史蒂夫·喬布斯傳》、《分布式系統原理與范型》這三本被擺放在右側第三排上。
用這三本書來概括王堅似乎也很合適。工程心理學出身的王堅,用魔幻現實主義色彩帶領著團隊,所有的阿里云產品在內部被冠以傳統神話中神的名字:阿里云的核心技術引擎被命名為“飛天”,一位親水的神仙;協同調度系統稱為“女媧”;“分布式文件系統”叫做盤古等等
從2008年11月加盟阿里集團開始,王堅在集團首席技術官和阿里云總裁角色之間不斷轉換。辦公室里整墻貼滿“云OS”效果圖,與團隊在辦公室旁的“鐘馗道-爭端解決室”開會到深夜已成常態,王堅有著產品經理敏感執著的特質。
在王堅眼里云計算是一場革命,是一場用服務顛覆傳統軟件硬件時代IT建設舊思維的革命。王堅這樣概括“去IOE”運動和阿里云之間的關系:“去IOE”徹底改變了阿里集團IT架構的基礎,是阿里擁抱云計算,產出計算服務的基礎。“去IOE”的本質是分布化,讓隨處可以買到的Commodity PC架構成為可能,使云計算能夠落地的首要條件。
從“去IOE”到擁抱開源技術,從整個集團的IT支持到阿里云未來發展,這些都使王堅有了幾分神秘的色彩。在ITValue社區(中國最大的基于知識分享的CIO人際社區) 會員通過發帖和微信交流群對王堅展開提問,王堅認為:“與CIO的交流將成為阿里云競爭力的來源,是中國的用戶在把云計算推到一個新高度。”
Q:為什么“IOE”對互聯網企業的發展是—個問題?“去IOE”和開源對IT團隊的技術儲備有多高要求?(by博士倫中國公司 IT director汪華)
A:不同的人在理解“去IOE”的原因是不一樣的。我最怕將“去IOE”的原因歸結到兩個極端:一是單純變為企業成本問題,二是簡單地變成一個是否用國外產品和技術的問題去討論。成本降低是“去IOE”最先能夠看到的,但最根本的原因是在互聯網時代,不只是互聯網企業,絕大部分企業對計算需求難以通過IOE提供的技術來滿足了,IOE約束了企業長遠的發展;技術路徑上依賴于專用的硬件設備比較危險,隨處可以買到的Commodity PC的架構長遠來講對于阿里和大多數企業則是最安全的。對于成本,我想說今天所有講的開源技術只解決了軟件使用成本的問題,而忽略了開源軟件的升級和維護成本。
理論上只要計算能力夠,“IOE”就一定能去掉!但實際上“去IOE”這件事有技術挑戰和風險。對絕大多數企業,“去IOE”不是簡單改變軟件和硬件本身,用新的軟硬件取代舊的軟硬件,而是用新的方式取代舊的方式,是用云計算徹底改變IT基礎架構。
“IOE”是軟件時代或是“買計算機”時代的產物。在云計算時代,則變成買“計算”的時代,“去IOE”最好的解決方式是采用云計算,而不是買來一臺新的機器替代掉原有機器。這是一個行業的變化而不是策略的選擇,這件事情的挑戰是你心里是否接受所謂的“私有云”的消失,從信任傳統軟硬件廠商到信任云計算是一種安全的服務。
Q:是否有一天企業都采用開源,而且沒有軟件供應商只有服務供應商時,IT建設的一些困難才能夠解決?(by寧波方太廚具有限公司CIO 邴哲)
A:我想從阿里集團自身技術的發展解釋這一問題。阿里的技術發展從主要依靠商業軟件、到開源再發展到更多的自有技術或是說云計算。
阿里最早依賴商業軟件,從擁有20多個節點的Oracle RAC數據庫集群(當時是亞洲最大),到成為開發使用開源軟件MySQL最好的企業之一,到研發自己的關系數據庫OceanBase,也已用在了不同的業務場景。從用Oracle做處理數據,到用Hadoop集群(是業內單個機群節點數最多的Hadoop機群),再到用自己飛天平臺上的ODPS。這樣的演變路徑也表明:商業軟件、開源軟件跟自有技術永遠是一個搭檔,對于不同企業來說,只是百分比的問題,對于大的互聯網企業來說自有技術變得非常重要。阿里巴巴的許多自有技術,如飛天的核心平臺通過云計算的方式開放給別人,所以云計算是適合許多企業的另一種方式。我相信在未來,對大多企業來講,云計算平臺+自有技術+開源技術會變得越來越重要。
在很多場合大家習慣性的把開放直接等同于開源,其實開源不是開放的唯一手段,在互聯網時代,云計算是一種新的開放形式。在許多業務和應用場景下,與云計算相比,開源未必是最好的手段。開源軟件還是軟件,開源軟件本身是伴隨著軟件時代的產物,仍然需要較大成本投入在維護和升級。今天云計算的發展得益于開源軟件的發展同時云計算的出現對開源軟件的應用也會有沖擊,例如當云計算提供了關系數據庫服務時,你就要考慮是否還要購買或使用商業數據庫軟件或開源數據庫軟件。阿里云和CODE.CSDN及開源中國等機構的合作,也是希望開源社區和技術與云計算能更好融合,共同服務好用戶。
在互聯網時代,運行在數據中心里的軟件面臨運營的挑戰,復雜度很大。從使用軟件(包括開源軟件)到運營數據中心里的軟件是一次根本的變化,大部分企業還沒有這種服務能力,社會的分工也不能要求每個企業都去做這種運營。云計算給了企業一個機會,企業不需要買軟件,就可以享受最好的服務和計算能力。這就是為什么在互聯網時代,云計算平臺+開源軟件+自有技術會是一個基本格局,傳統靠收許可和服務費的商業軟件會越來越沒有市場。
Q:阿里云、天貓和淘寶的技術體系是怎樣的?在去IOE過程中,他們是如何協同?(by中國南方航空公司技術總監龍庚)
A:支付寶、天貓和淘寶、阿里云的實際技術應用確實有所不同,我們也一樣會遇到所有公司都會遇到的挑戰,但我們很幸運的是阿里巴巴整個技術體系是協同在一起的。
阿里整體技術的協同效率可以用幾個關鍵的事例來說明:第一是在“去IOE”過程中逐漸建立起對技術方向的認同和協作,當淘寶剛開始做這件事的時候,沒有技術、產品和業務等各團隊的相互協同,這是一件不可能的事;第二是在2011年,阿里集團所有的技術后臺運維和運營部門都集中在首席技術官下面,成立統一的技術保障部,原來在不同子公司和事業部的人,從工具到理念都需要融合,結果表明這樣對適應集團業務的快速發展和變化是很成功的,并且能夠用這樣的方法駕馭大型互聯網企業對技術服務的挑戰。這一過程中,我們經歷的技術和組織的挑戰與付出的學費可以為其他企業的借鑒。第三則是業務驅動的技術協同,淘寶“聚石塔”、支付寶“聚寶盆”等業務,都是在業務驅使下使得各自客戶的IT系統運行在了阿里云“飛天”平臺上,它是一種自然協同的結果。
Q:阿里云如何消除用戶對云計算安全的憂慮?用戶訪問速度如何保障?有無簡單的退出機制和遷移工具?(by州逸酒店和度假村集團副總裁 朱明生)
A:安全憂慮的本質是信任問題,信任問題唯一可以解決的方法是靠透明,阿里云歡迎所有CIO來挑戰云安全問題,透明真的是唯一的方式。在一次工信部召開的全國各省通信管理局負責人的會上,我也講,我們有強烈的需求讓政府監管我們!我們可以想一個方法,從你們的CIO俱樂部開始,制定一個很透明的機制,阿里云愿意被監管。
用戶訪問速度涉及兩個方面:一個是互聯網本身的速度;另一個是服務響應速度。今天我們的云計算服務解決了不同運營商互通互聯的問題,互聯網本身的速度是足夠滿足需求的。但應用服務的架構也會影響到響應時間,這需要技術的改進。很多人把服務和應用搬到云上來,是直接把原來的架構搬上來,這就需要我們和企業一起努力解決的問題。
關于退出機制,今天我們的很多客戶是從亞馬遜搬來的,同樣也有客戶因為不滿意我們的服務搬到別處去了。云計算是有黏性的,但今天是一個開放競爭的環境,沒有人有能力畫地為牢。我們也提供相應的遷移工具,只是任何遷移都是有成本的。我認為這可以和信任問題一起討論,需要大家的共同規范。
連載一:王堅:阿里巴巴為什么“去IOE”
連載二:阿里巴巴雙十一的秘密
連載三:阿里巴巴如何“去IOE”
連載四:王堅:云計算是一場革命