2009年數據庫技術領域回顧
簡要回顧一下2009年數據庫技術領域。過去的一年,差不多也可以說是過度的一年,數據庫技術以及數據存儲產品等都都或多或少發生一些方向上的轉變。
Oracle收購Sun,MySQL前途未卜
Oracle收購Sun可謂一波三折。在獲得美國司法部門的批準后,歐盟委員會又開始調查,Oracle隨后拋出一個"十條保證",眼看著歐盟就要點頭,沒想到MySQL創始人Michael Widenius(Monty)則在這個當口不失時機的搞出來一個"拯救MySQL"的抵制活動,讓Oracle頭疼不已。Monty這人多少也有點上綱上線,現在已經將MySQL的命運和"InternetFree"這個大話題綁在一起了。
沒有人會相信Oracle會善待MySQL,誰會干放虎歸山的事情呢?換了你也會把MySQL雪藏起來,畢竟商業公司就要逐利。但是,也很難說一旦收購完成后,MySQL會在短期內消失,基于MySQL眾多開源分支以及解決方案也都發展的不錯,我相信最終決定權還是在用戶的手里。就算沒有MySQL,也沒準兒會有YourSQL出來的...
盡管口水戰還在進行,MySQL的開發者倒是沒閑著,在年底發布了5.5第二個里程碑版本,原來站點上的6.0系列的信息全部撤掉。5.5更像一個集成版本,將不少第三方貢獻的功能改進(比如Google的Patch)融合了進來。
而Oracle這一年在產品上的一個標志性事件是推出了Exadata存儲第二版,與***個版本不同的是,這一個版本在OLTP方面增強了許多。從這個版本開始,Oracle正式擁有自己的存儲硬件(***版是和HP合作的產物)。RDBMS上,除了發布11g第二版之外,也在做功能上的調整,這一次,面向的是數據中心。
NoSQL的興起
這是今年數據庫領域最有趣的話題。NoSQL的由來大約是這樣的:當時還效力于Last.FM的Johan Oskarsson(現在已經投靠Twitter了)組織了一個技術會議,話題是關于"opensource,distributed,nonrelationaldatabases",為了方便一點,想出來一個"NoSQL"的術語。然后由Rackspace的EricEvans引用,進而流傳開來(refer)。NoSQL在基于Key-value的存儲解決方案上提倡去SQL化,尤其避免表連接,并且通過一些變通的辦法提供RDBMS的ACID功能(如果需要的話)。
NoSQL的理念能夠短時間內被技術圈所接受,離不開基本的理論支撐:最終一致性、BASE、CAP這三大基石;一方面是基于Key-Value的數據存儲解決方案更加成熟,
所謂NoSQL,是針對當前對關系型數據庫的過度依賴與運用而言,不要將其當成***藥,也沒必要過于激進的推行NoSQL的模式。在我看來,NoSQL是針對爭奪應用模式上的一種理念上的運用。對多數企業來說,仍屬屠龍之技,沒必要照搬解決方案。至于傳統的RDBMS是不是已經走向末路,我認為不盡然。RDBMS依然尤其廣泛的應用場景,而NoSQL如果要有更大的作為也要有來自商業上的更大支持才會有所突破。
SSD被更多企業接受
Jim Gray在2006年的那句名言:Tape is Dead,Disk is Tape,Flash is Disk,RAM Locality is King,現在正在被現實所驗證。2009這一年,用戶已經開始進一步試水SSD產品,包括MySpace、Last.FM等網站已經開始在關鍵應用上部屬SSD(refer:1,2)。而國內也有很多企業對SSD進行嘗試性的使用,這其中包括阿里巴巴、優酷。
更多的存儲廠商已經在高端存儲中兼容SSD,除了去年的EMC嘗鮮之外,現在IBM、HDS、NetApp都加入了這一陣營。
隨著SSD的價格迅速下降,很多存儲廠商已經開始調整硬件架構,現在有個看似可行的趨勢是在Cache層與磁盤層之間多構建一個SSD存儲層,在成本與性能之間做一個折衷。
在去年年底的回顧中,我曾大言不慚的說"相信2009年會是SSD爆發的一年",總體來看,2009年對SSD的部屬還談不上"爆發"。中規中矩而已。
Amazon EC2對MySQL企業版的支持
盡管我不愿意談云計算,不過Amazon這一年在云計算方面還是做了很大的突破,Amazon EC2上面現在已經可以跑MySQL企業版了,采取按照增長付費('Pay-as-we-Grow')的模式讓初創公司有更多的選擇,這比SimpleDB可以說是前進了一大步。這種模式在國內是否可行,考慮到當前內容審查的問題,還有待商榷。
國內Key-Value產品
這一年來國內對Key-Value產品的研究與運用和國外基本沒太大的距離,豆瓣網先作出了不錯的表率,發布了BeansDB存儲系統,這是一個豆瓣風格的Dynamo實現,采用類似Memcached的去中心化結構。而最近得到的消息說人人網也要將其內部使用的存儲系統Nuclear開源。相信在新的一年可供參考的Key-Value會層出不窮。
其它方面
Hadoop過去一年中沒有太大的變化,上了一點規模的網站都在用,快成了Web數據分布式計劃的標準組件了。Doug Cutting出走Yahoo!還是帶來了一定的影響,不知道今后Yahoo!在Hadoop方面的支持力度會如何。至于面向列的DB發展情況,在過去的一年中進展不大。SQLServer和DB2等方面似乎沒什么可圈可點的大事,倒是PostgreSQL因為MySQL的不確定性而取得了不小的增長。
有一點要補充的是,假以時日,Open Data或許也將成為一個趨勢。
當然,這份回顧有濃郁的個人色彩,有不同意見請留言探討吧。
原文標題:2009年數據庫技術領域回顧
鏈接:http://www.dbanotes.net/database/database_event_2009.html