揭秘開源商業的底層系統:我們為什么看好開源商業?
GGV有話說:
《GGV中美企服20年采訪札記》系GGV過去20年中,在企業服務行業大浪淘金后的成果和收獲,通過GGV投資人與企業創始人或高管的對談,呈現其成功背后的商業邏輯與格局。
本系列共15篇章,聚焦云基礎設施、企業軟件消費化以及電商服務三大板塊。每一篇都回顧了企業生根發芽的發展進程,也展示出企業破土而出的精彩時刻;翻閱歷史的同時,思考當下的步伐,為各領域致力于開拓創新的創業者和試圖改變世界的開荒人提供一份寶貴的創業啟示錄。
《GGV中美企服20年采訪札記》的第四篇,我們將和你講述我們為什么看好開源商業?
2015年,PingCAP 創始人兼 CEO劉奇、PingCAP 聯合創始人兼 CTO黃東旭、PingCAP 聯合創始人兼CFO崔秋三人創辦了PingCAP,主打產品是分布式關系型數據庫產品TiDB。在他們的商業版圖里,“開源”(Open-Source)極其重要,TiDB的發起、完善等各環節均依托于開源。
PingCAP創始團隊成員:黃東旭(PingCAP 聯合創始人兼 CTO)、劉奇(PingCAP 創始人兼 CEO)、崔秋(PingCAP 聯合創始人兼CFO)
這使PingCAP成為了當年中國極其少見的“出生即開源”并以創業者身份運營的企業之一,它的源代碼從始至終都可供任何程序員查看和使用。在全球最大開源開發者社區GitHub上,TiDB共計獲得27000+的Star,集合了超過1200位開源代碼貢獻者,是基礎架構領域的明星開源項目。
雖然在程序員群體里口碑爆棚,但對于PingCAP是否能成為一家偉大的企業,業界仍在持續觀察,在很多人眼中,這些“開源英雄”能否成功,還要看他們在商業化的成就。
開源的商業化從來都不是一件容易的事情。創辦3年后,PingCAP的商業化進程開始逐漸加速。在CEO劉奇的介紹中,截至2020年底,它擁有超過1500個客戶,其中付費客戶超過百家,中國客戶最高客單價規模為百萬人民幣,尤以中國銀行、中國人壽、國泰君安、陸金所等金融企業為主要付費客戶。2020年PingCAP完成了2.7億美元的D輪融資,從融資階段到額度,都是中國創辦的開源產品之最。
GGV紀源資本管理合伙人符績勛認為,中國公有云化現在進入到0到1的成長階段,這意味著企業互聯網和SaaS服務的崛起。SaaS公司現在越來越多在強調SaaS屬性和功能,真正做到了軟件即服務。中國整體已經在往積極的方向去努力,我們也看到一大批企業服務公司業務的增長在加快,其中更包括開源產品的進化和迭代。
作為PingCAP的投資機構,GGV紀源資本一直是開源產品的堅定支持者。在海外,GGV投資了全球最頂尖的云公司之一HashiCorp,它的開源軟件每年下載量接近8000萬,全球500強企業里有100家以上為其客戶,最近一輪的估值高達51億美元;GGV也投資了人工智能和機器學習框架開發商Streamlit,在程序員群體中熟知的API自動化服務Kong,還有總部位于柏林的開源神經搜索初創公司Jina AI。
而在中國,除PingCAP之外,GGV紀源資本企業服務團隊分別投資了2014年開始正式商業化運作的RT-Thread以及2019年正式開源的濤思數據。
如果說軟件正在吞噬世界,那么開源則正在改寫整個軟件界。
PingCAP走過的路:
“那幫理想主義者還沒餓死”
當一款產品在C端迅速走紅或出圈,隨后帶來的最大風險是什么?
在擁有14億人口的中國市場,潛在的最大風險其實是數據庫宕機。
數據庫作為快速成長企業當中最容易滋生痛點的基礎設施,在數據暴漲或難以預知數據爆發節點的情況下,一旦數據庫出現問題,就如同飛機在飛行過程中不得不更換引擎。
PingCAP團隊5年前創辦時預測:大數據驅動下,全球數據量過載將是必然趨勢,單機MySQL數據庫難以滿足企業要求,更多企業將選擇一款云端的彈性化數據庫。這成為了PingCAP創立的初衷:PingCAP立志為這些快速成長的企業做好云端的數據庫服務。
而此時,數據庫市場還是Oracle等巨頭的天下,做數據庫研發的創業公司鳳毛麟角,用PingCAP投資方、GGV紀源資本執行董事吳陳堯的評價來概括:“想攀登珠峰的人并不多”。
PingCAP海外的支持者分布圖
更有意思的是,從創辦第一天起,PingCAP就公開了源代碼,PingCAP CEO劉奇介紹,所有貢獻者都可以提交代碼修改,并有可能改變PingCAP的主干代碼,這些代碼修改形成一個大循環,迅速更新和完善數據庫性能。
這也是PingCAP另一個頗為“另類”的決定:開源。
在開源社區這個“委員會”之中,任何企業的程序員都能成為開源社區的貢獻者,而這些企業就像派駐了一位代表加入這個“委員會”,他們的意見一定程度上代表了自己所在企業的思考與需求,他們的修改造就了PingCAP的迭代升級。
2015年的互聯網行業,舉起開源這桿大旗的人并不多,PingCAP為此花費了大量精力,主辦了以交流國內外基礎架構技術為主題的InfraMeetup,如今算下來,總計舉辦次數已經超過130期。
在創業者后輩的眼中,PingCAP的成功是有自己的獨特策略和打法的。這套策略并不比別人高深多少,也并非像電影里的絕世高手突然機緣巧合收獲了一份武功秘籍,而是來源于堅持不懈、源源不斷地在幾件重要的事情上傾注力量:
比如堅持常年在一線苦心研究技術,比如堅持舉辦開源技術交流論壇和線下活動,并把自己的鉆研所得分享出去,毫不吝嗇地發表內容并鼓勵大家發言,作為領頭人引導社區內容蓬勃發展。
“PingCAP特別主張技術驅動,它的開源方式甚至不像一家中國公司。”同為企業服務市場創業者,身份云平臺Authing創始人謝揚認為PingCAP的策略是站在技術制高點上:“它發表的內容質量極高,而且從架構師到開發者都在持續發文章到全球最頂尖的工程師平臺,其中很多篇甚至是英文文章,吸引中國的譯者翻譯回來,發表在中國的各類技術營銷渠道上。”
另一個讓后輩欽佩的特點是,PingCAP前面兩年的重心是技術累積,對商業化并不著急。直到2018年,搭載著云端SaaS服務,它的商業化才隨之而來。
“云”不僅將企業服務軟件的交付進行了標準化,也將提供服務的方式進一步標準化。
首先,PingCAP的產品更新會實時同步給所有客戶——這與傳統軟件廠商的長達幾個月的響應時間大相徑庭;
此外,通過SaaS,PingCAP實現了高效部署,傳統數據庫產品需要一年時間部署,PingCAP為代表的云端數據庫只需要一兩個月;SaaS為PingCAP本身則帶來了更為靈活的銷售模式,中小企業客戶只要綁定信用卡,就可以立即開始使用。
CTO黃東旭記得,剛上線沒多久,一家臺灣企業就直接綁了一萬美金開始使用,很久一段時間PingCAP都不清楚這家企業的業務是什么。
在美團、嗶哩嗶哩、小米、摩拜等企業迎接用戶量暴增的時候,這些企業們同時也成為了PingCAP用戶,這意味著它們擁有了更靈活的架構和彈性數據庫,不需要由于雙十一帶來的多倍銷售而購買更多服務器。
在國內以金融類為代表的企業需要私有云部署,劉奇曾透露,國內的客單價在百萬元量級,國外更是數倍之高。由此它的出海效應也相繼產生,公司陸續服務于Square(美國)、PayPay(日本)、Dailymotion(法國)、Shopee(新加坡)、ZaloPay(越南)、BookMyShow(印度)等海外產品。
開源為PingCAP帶來的優勢不止于此,因為開源,大廠工程師們對開源產品的貢獻更是讓PingCAP受益匪淺。“現在實際上參與開發PingCAP的人員,已經有1000多個人了。很難想象一個公司,在某一個單項產品上面,投入1000多個研發是個什么概念?而這還只是開發人員。”劉奇說。
在劉奇與團隊看來,單點上的巨大投入是讓創業公司“活下來、參與競爭,甚至跟巨頭去PK”的條件。
這些使PingCAP的TiDB成為了中國本土誕生的現象級開源產品,三位創始人成為了開源商業的傳教士。
“PingCAP帶了一波節奏,不少開源愛好者也陸續出來創業了,”PingCAP認為,“我們能做的就是讓大家看到,在中國還能有這么一幫理想主義者在堅持,同時也沒餓死。”濤思數據創始人陶建輝在2019年7月宣布將產品TDengine開源,背后也有老友PingCAP的助力,TDengine將最核心的存儲引擎和計算引擎上傳到GitHub的兩周時間,收集到的Star已經超過了7300。
而作為背后的投資機構,在GGV看來,“開源”是這些toB 產品最重要的加分項,而“開源商業”也成為了一個投資主題。
無論是底層數據處理還是數據產出層,或者更前端的應用;無論是數據庫還是物聯網、人工智能,理論上,一切產品皆可開源。
TDengine與RT-Thread背后所搭載的是物聯網這個萬億市場,但開源為它們插上了翅膀。“盡管目前的開源產品數量不多,但趨勢已經形成,將開源產品商業化的創業者會越來越多。”吳陳堯說。
為什么一定要開源?
PingCAP CTO黃東旭在2020年發表了一篇文章,《大教堂終將倒下,但集市永存》,這篇文章的標題與開源愛好者的圣經《大教堂與集市》(Eric Raymond著)呼應:集市的特點是開放式建設、成本低、周期短、品質平庸;大教堂的特點是封閉式建設、成本高、周期長、品質優異。
黃東旭認為,以開源為代表的“集市”將永存。在文章中,他拆解了程序員不愿將自己的代碼開放,企業經營者不認可開源作為核心競爭力的邏輯。在他的解讀中,除非某家企業能在自己的行業達到徹徹底底的人才壟斷,否則它們的“核心”算法都將是對手也能得到的。唯有開源帶來的持續迭代與產品升級才能為一家公司賦予生命力。
任何信仰的傳教士都肩負重任。“開源”誕生以來,曾帶來不少質疑,他身上的標簽不僅有“共享智慧”和“無國界”,也有“免費”二字。以至于很多人質疑:開源就意味著源代碼免費共享,而免費又如何能形成商業化?
然而,“免費”并非開源的宿命。
1984年,麻省理工大學(MIT)的計算機教授理查德·斯托曼(Richard Stallman)成立基金會FSF(Free Software Foundation),最初目的是以自由免費對抗大公司的授權費要求,但此后基金會成員認為FSF使用的“自由(Free)”這個詞讓人想到免費使用,而這不是自由軟件的內核,他們不希望將開源商業變為公益機構,所以用“開源”(Open-Source)取代了“自由(Free)”。
開源運動的背景下誕生的典型代表就是Linux。
Linux擁有無數系統開發商,它所開創的模式是由多家公司共同主導一款開源產品的商業化變現,最大的一家Linux系統開發商RedHat在2018年以340億美元被IBM收購,被稱為使IBM“付出了60%溢價”;依托Linux開發而成的Android橫空出世并成為全球第一大智能手機操作系統,直接威脅了蘋果的地位;全球最大開源開發者社區GitHub被微軟75億美元收購……這些“戲劇性”事件讓我們看到開源產品的商業價值。
PingCAP早期的手繪產品圖
盡管開源產品的底層系統(如Hadoop等)來自于大公司的開發成果,盡管擁有全球規模最大且最優秀程序員的Google,Facebook等具備閉源的開發實力,但依托于社會資源的聚集,開源仍然成為了帶動科技創新最重要的力量——以至于全球最大的開源公司并非別人,而是Google,Facebook等大廠——每家內部都堪稱開源項目的驅動中心。
開源傳教士們驗證了他們的判斷。PingCAP的兩組數據尤其值得關注:從2018到2020年的一年多時間,TiDB的SQL層項目發生了30000多次提交,有接近60%的源碼被修改。從代碼修改效率到提升空間來看,開源項目的表現都十分亮眼。
然而,開源軟件商業化卻從不是一件容易的事情。全球的開源軟件項目有數千萬個,三大基金會(Linux、Apache、CNCF)的托管項目有600+,但是真正商業化成功的開源軟件的公司卻只有10余家,國外的典型代表有Red Hat、Databricks、MongoDB、Elastics、Confluent、HashiCorp等(GGV紀源資本投資了其中的多家企業),而PingCAP則是國內企業的佼佼者。
在商業化方面,PingCAP給出了自己的觀點:開源軟件本質上是通過放棄一部分通過信息不對稱產生的潛在利潤,換取了極其高效的傳播和場景觸及效率,但是有意思的是,實際上犧牲掉的這些潛在利潤大概率也不一定真的犧牲掉。
因為,一來可能本身付費能力有限,二來可能實際上這些用戶通過宣傳站臺二次傳播或者代碼貢獻等方式回饋了項目本身;如果一款產品是閉源的,這款產品解決的問題又足夠普遍且高價值,那么長遠來看一定會有一個開源的解決方案吞掉一切。
吳陳堯則認為,開源模式在增長和商業上都跟To C端互聯網公司有著類似的邏輯:
To C端產品在打磨和增長過程中,崇尚通過大量的用戶反饋和數據來實現迭代,而開源產品也在高度依賴在社區中去搜集bug和對新功能的需求;
在商業上,偉大的To C產品通常是以先創造用戶價值,再探索變現方式的路徑實現商業價值,也就是巨大的用戶價值(通常可以以用戶數和依賴程度來衡量)最終一定會有巨大的商業價值與之相匹配,而開源模式也將用戶的喜愛視為一個項目或社區存在的最高目的,堅信商業價值是一個自然而然的過程。
不僅如此,GGV企業服務投資團隊認為,開源優勢能夠做到品牌效應、規模效應以及極低的獲客成本,這在巴菲特所提出的護城河即商業壁壘中極為關鍵。
而我們不能忽略的重要一點是,開源帶來的護城河由何而來?
首先,開源社區讓無數程序員注意、甚至貢獻代碼進入某款開源產品,而這些程序員對于自己參與“養成”的產品極其關注并愿意使用。
PingCAP對程序員群體的理解是,很多程序員對物質沒有太大的感覺,但骨子里有理想主義情懷,他們更希望做一些影響世人的事情,“想要攀登珠穆朗瑪峰”。
也正因此,隨著開源社區產品的知名度增高,程序員群體中影響力變強,就出現了越來越多的“銷售線索”,因此形成了商業壁壘,并逐漸積累了口碑。
此外,在美國與如今的中國互聯網行業,大多IT基礎設施的采購是自下而上的,這意味當底層的程序員可以做決策時,他們自然會推薦自己所認可的開源產品。
GGV投資的另一款產品RT-Thread創辦于2006年,創始人熊譜翔曾談到商業化轉型中的順利之處:很多自己上下游企業的CTO與技術團隊都貢獻了代碼到RT-Thread,與他們的合作多是一拍即合,根本無需對產品做過多介紹,積累十幾年的影響力已經足以形成轉化為銷售的勢能。
再次,GGV企業服務投資團隊認為:互聯網行業對開源產品的使用本身已經成為趨勢,在當今各類互聯網產品團隊的代碼庫中,開源代碼的比例在逐漸上升。開源代碼不僅免費,而且質量已經被認可,能夠為企業節省人力成本和時間成本。
對一家VC而言,一款有極低獲客成本的產品意味著足夠強的吸引力。不過,在GGV對開源產品的觀察中發現,“是否開源”與一款產品的性質有關,偏底層的IT基礎設施與操作系統“值得”開源,甚至以開源為最佳、最簡單的方案,但是一些前端應用即使開源也很難獲得更大的商業化空間。
PingCAP的TiDB,濤思的TDengine,RT-Thread都是底層產品,而且PingCAP的TiDB作為數據庫產品所產生的更換成本極高,客戶將數據庫放入系統后,幾乎很難更換,這帶來了極高的客戶流程。
“是否開源”與這款產品所在的競爭格局也有關,如果所在的市場已有巨頭提出解決方案,那么創業公司將不得不用開源的方式實現彎道超車。
RT-Thread創始人熊譜翔提到市場所帶來的機遇,在RT-Thread所在的IoTOS賽道上,華為等中外硬件大廠均擁有自己的OS,但很多中小客戶寧愿尋找一套中立的系統,而這就帶來了RT-Thread等第三方IoTOS的機會。而巨頭的解決方案往往可能只適合巨頭,并不如創業公司的產品更加專注。
除此之外,開源將無疑助推企業服務產品的出海進程。海外客戶對中國誕生的產品普遍仍有一些顧慮,“中國公司出海開源其實是一個比較有機會的模式,甚至有可能是唯一的模式。”吳陳堯說。
開源英雄的時代
讓一向深耕企業服務市場的GGV格外關注開源商業的是一系列案例:MongoDB和Elastic是兩家開源代表企業,從傳統軟件企業的銷售方式到開源+SaaS服務之后,市值分別從上市時的18億美金和25億美金漲到了如今的247億美金和140億美金;GGV在2012年投資的HashiCorp近年客單價增加,并且獲得了一系列大客戶的青睞,以至于全球500強企業里有100家以上為其客戶,而在GGV最初投資的時候,除了Redhat沒有其他開源公司上市,況且Redhat的模式也只是基于開源項目Linux進行商業開發。
在大洋彼岸的中國市場,開源的聲音從未停止。首先,越來越多的中國開源愛好者成為開源貢獻者。中文IT技術交流平臺CSDN曾提到,從數量和貢獻度上,中國的開發者都已經達到了GitHub全球4000萬的注冊用戶中的第二位;中國的活躍開源項目貢獻者,有40%以上都是在2019年內加入的,其中大多都是90后的年輕人。在Github全球公司開源項目貢獻榜上,阿里巴巴與騰訊分別位列第5位與第9位。
真正縱身跳入開源創業的中國創業者是少數,但也已形成趨勢。這其中,有些是以開源撬動發展的創始人,如PingCAP的劉奇、黃東旭、崔秋和濤思創始人陶建輝,有些則是“老版主”終于選擇創業,如熊譜翔。借用HashiCorp創始人Mitchell的話來說,他們的出現是“醞釀了十年的一夜成名”。在開發者社區SegmentFault思否發布的《中國開源先鋒33人之心尖上的開源人物》榜單中,黃東旭、陶建輝、熊譜翔均已上榜,而其中更多開源英雄還在大公司麾下。或許幾年后,他們姓名前的職稱將被書寫成為自己創辦的企業。
所幸這個市場需要更多開源創業者去改寫。Oracle等傳統軟件巨頭是軟件創業者的挑戰對象。在PingCAP剛成立的2015年,Oracle在中國數據庫市場的占有率高達56%,也是很多金融行業客戶的首選。但它在中國企業服務尚未起飛的前幾年也曾折戟,“中國市場曾是地獄級,”PingCAP透露,“Oracle在整個中國的收入占全球的比例,大概不到3%。”
在中國,企業服務軟件不僅有中國巨大的成長空間也有最極端的互聯網環境。一方面,在競爭之下,每家企業都渴望自己的架構更靈活,更新速度更快;另一方面,網民數量外加“雙十一”等大型事件營銷會對各類互聯網公司帶來不可小視的數據沖擊,劉奇認為Google的成功建立在數據處理量極其龐大的前提下。而對于數據庫來說,中國市場“場景夠極端,能打磨產品”。
凌駕在中國企業服務的大勢上,開源創業者將面臨特殊的機會。吳陳堯對中國開源創業者的建議是:注重社區的搭建,以技術作為立身之本;從創辦之初就注重國際化,鼓勵中外工程師共同參與;商業化進程視具體服務的客戶群來決定,在社區形成一定的規模后就可以商業化。
*GGV紀源資本企業服務小組:GGV深耕企業服務行業20年,目前在全球11個國家有100家被投企業,其中獨角獸企業達23家,已經完成上市的企業有15家。