官宣:Cloudberry Database 正式加入 Apache 孵化器
2024 年 10 月 12 日,Cloudberry Database 項目通過投票獲準加入 Apache 軟件基金會孵化器[1],這標志著 Cloudberry 項目及其社區的一個重要里程碑。2024 年 11 月 5 日,Cloudberry 項目的關聯代碼倉庫遷移至 Apache 軟件基金會。隨著此次轉變,Cloudberry 正式加入 Apache 孵化器,并在其旗下啟動孵化開發。此外,Cloudberry Database 正式更名為 Apache Cloudberry? (Incubating)。
Cloudberry Database 加入 Apache 孵化器并更名為 Apache Cloud
什么是 Cloudberry
Cloudberry 由 Greenplum Database 原始開發者創建,是一款領先且成熟的開源大規模并行處理(Massively Parallel Processing,MPP)數據庫。它基于開源版的 Pivotal Greenplum Database? 衍生而來,但采用了更新的 PostgreSQL 內核,并具備更先進的企業級功能。Cloudberry 可以作為數據倉庫使用,也可用于大規模分析和 AI/ML 工作負載。
帶有 Apache Incubator 圓環的 Apache Cloudberry 標志
Greenplum Database 已被眾多不同行業的小型、中型和大型團隊廣泛采用,并長期位居 DB-Engines 網站[2] 最受歡迎的 Top50 數據庫。然而,隨著開源版本 Greenplum Database 走向歸檔以及其社區徹底關閉,原開源用戶將無法免費獲取安全或功能更新,這對他們的業務造成了潛在挑戰。
我們希望 Cloudberry 成為原 Greenplum 開源版本的主要開源替代方案。我們也期望所有 Greenplum 的開源開發者和用戶能夠遷移到 Cloudberry 上來。
Cloudberry 的來龍去脈
在展開后續內容之前,我們希望回顧一下 Greenplum Database 從閉源到開源(2015 年 10 月),再到重新閉源(2024 年 5 月)的歷史:
- Greenplum Database 最早發起于 2003 年,基于 MPP 架構和 PostgreSQL 技術,由 Greenplum 公司創建。
- 2010 年,Greenplum 公司被 EMC 收購。
- 2012 年,EMC 和 VMware(EMC 的子公司)將包括 Greenplum Database 在內的若干軟件資產合并為一家新公司 Pivotal Software。
- 2015 年,Pivotal 開源了 Greenplum 的核心引擎,并將其重新命名為 Pivotal Greenplum Database?,成為行業第一個開源的 MPP 數據倉庫。Pivotal Greenplum Database? 的開源核心還促成了 Apache HAWQ 和 Apache MADlib 項目,但 Greenplum 本身仍是單一廠商所有的開源項目。
- 2019 年,VMware 收購 Pivotal Software。本次收購使得 Pivotal Greenplum Database? 重回 VMware。此后,VMware 繼續支持 Greenplum Database 的開發及其開源社區,并在后續幾年提供 VMware Tanzu Greenplum 作為其商業產品。
- 2023 年 11 月,Broadcom 完成對 VMware 的收購,Greenplum 歸屬于 Broadcom[3]。
- 2024 年 5 月,幾乎所有的 Greenplum GitHub 倉庫被歸檔并設置為只讀,其 Slack 工作區(https://greenplum.slack.com)被刪除,原有的 user[4] 和 dev[5] 郵件列表停止活動,此類操作均未在提前發布相關聲明的情況下進行。
可以看到,Greenplum Database 多年來頻繁更換所有權,引發了社區用戶、開發者和生態伙伴的擔憂。由于受單一廠商控制,Greenplum 缺乏允許社區參與決策的開放治理模式。
Cloudberry 的構建者認識到 Greenplum Database 已長期缺乏創新動力和主要功能更新,與新一代開源數據倉庫和分析項目相比競爭力不斷下降。
Cloudberry 項目始于 2022 年,由原 Greenplum 開發者打造,并在 2023 年開放源碼。當 Greenplum 突然轉為閉源時,這一變化令人吃驚。從那時起,我們堅定了繼續使命的決心,致力于團結原 Greenplum 的開源開發者和用戶,并以社區方式打造我們的項目。
Cloudberry 不是簡單換名。它擁有宏偉的愿景,并提供許多先進功能與解決方案(備注:部分功能已在路線圖上并等待開源進而貢獻到主分支),包括更新的 PostgreSQL 內核、增強的安全性、端到端性能優化、支持 AI/ML 工作負載及流處理、湖倉集成等。我們致力于讓 Cloudberry 與 Greenplum 保持兼容,讓用戶可以像使用 Greenplum 一樣使用 Cloudberry。
為什么選擇 Apache 孵化器?
加入 Apache 孵化器是 Cloudberry 的一大進步,打開了與開源世界協作、社區增長和創新的大門。Apache 孵化器為開源項目提供了治理、指導和項目管理的框架,確保項目的成長符合“Apache 之道”(Apache Way),實現以社區驅動的開發模式,保持透明和開放協作。
隨著 Cloudberry 加入孵化器,我們比以往任何時候都更加致力于培養充滿活力、多樣化的開發者社區,并鼓勵來自全球的貢獻者參與。Cloudberry 也可從經驗豐富的 Apache 孵化器導師們的指導中受益。我們希望通過踐行“Apache 之道”(Apache Way),推動 Cloudberry 順利從 ASF 孵化器畢業,并成為一個成熟且成功的頂級 Apache 項目。
致謝
感謝來自 Cloudberry 社區的所有貢獻者,以及我們上游項目貢獻者的辛勤努力!感謝 Roman Shaposhnik 作為我們的 Champion,感謝 Willem Jiang 和 Kent Yao 擔任我們的導師!
加入我們
隨著 Cloudberry 開始在 Apache 孵化器中的激動人心的旅程,我們邀請開發者、數據科學家和數據庫愛好者一起參與進來,共同塑造 Cloudberry 的未來。無論是貢獻代碼、分享使用案例,還是參與討論,我們歡迎每個人加入 Cloudberry 不斷壯大的社區。
關注我們
您可以通過以下方式找到我們:
- 網站:https://cloudberry.apache.org
- GitHub:https://github.com/apache/cloudberry
- Slack:https://apache-cloudberry.slack.com
- 開發者郵件列表:
- 訂閱開發者郵件列表:發送郵件至 dev-subscribe@cloudberry.apache.org[6]
- 瀏覽過去的郵件列表討論:https://lists.apache.org/list.html?dev@cloudberry.apache.org
引用鏈接
[1]
2024 年 10 月 12 日,Cloudberry Database 項目通過投票獲準加入 Apache 軟件基金會孵化器: https://lists.apache.org/thread/qzfb38dzb1x3cg29snq4doy95gd6pzy8[2]
DB-Engines 網站: https://db-engines.com/en/ranking[3]
Broadcom 完成對 VMware 的收購,Greenplum 歸屬于 Broadcom: https://investors.broadcom.com/news-releases/news-release-details/broadcom-completes-acquisition-vmware[4]
`user`: https://groups.google.com/a/greenplum.org/g/gpdb-users[5]
`dev`: https://groups.google.com/a/greenplum.org/g/gpdb-dev[6]
dev-subscribe@cloudberry.apache.org: mailto:dev-subscribe@cloudberry.apache.org
活動推薦
Apache Cloudberry? (Incubating) Meetup · 2024 上海站將于 2024 年 12 月 7 日舉辦,籌備活動已經啟動!
為了讓社區用戶更全面地了解 Cloudberry,酷克數據聯合社區成員們共同發起 Apache Cloudberry? (Incubating) Meetup系列活動,本期上海站作為全國巡回的重要一環,期待能和更多華東區域的朋友們見面。
未來,Meetup 活動還將走入更多城市,與全球范圍內的 Greenplum 、PostgreSQL 用戶、開發者及大數據領域的技術愛好者,共同探討開源技術的創新與未來發展,發現更多實踐可能。歡迎感興趣的朋友掃碼報名!
名額有限,先到先得!加入我們,見證開源數據庫領域的新興力量。