嘉賓丨崔寶秋
整理丨千山
在日前由51CTO舉辦的WOT全球技術創新大會2022中,小米集團副總裁崔寶秋帶來了主題演講《開源本質與技術創新》,著重介紹了他是如何看待開源的,國內諸多公司在積極地擁抱開源的同時面臨的種種問題以及應該如何回歸開源的本質。現將其演講內容精編如下,以饗讀者。
正文
開源是一個理念,是一個運動。
但開源包含的內容不止于此:它同時還是一個開放、協作、創新的平臺,是一種開發模式,也是一種商業模式。
一、沒有開源,就沒有今天的互聯網
(下)圖中列舉了開源發展史上的重要里程碑以及具有重大意義的開源系統。我覺得,開源的星星之火之所以能夠燎原,離不開它們的蓬勃發展。
90年代我去美國讀書時,“開源”在彼時還不叫“開源”,而是“自由軟件”。
- 1983年公布的GNU項目是我最開始接觸到的開源系統;
- 1991年Linux誕生;
- 1998年“Open Source”一詞被提出,OSI(開源組織,Open Source Initiative)隨后成立;
- 2006年Hadoop誕生;
- 2008年,安卓1.0發布,移動互聯時代拉開序幕;
- 2014年Kubernetes和2015年TensorFlow的發布則分別為云原生和AI時代的到來添加了助力。
毫不夸張地說,沒有開源就沒有今天的互聯網,也沒有如今的科技生態。沒有開源,就沒有今天的云計算,大數據,人工智能,移動OS,智能新時代……
在之前小米的發布會上,雷總提到了小米的六大科技:手機、穿戴設備、智能家居、智能制造、智能電動汽車、仿生機器人。仔細想一下,其實這些都離不開開源。
智能時代的開源無處不在,開源運動如火如荼,尤其是這兩年,中國的開源運動在政府的推動下越來越迅猛,從政府到企業到學術界都在深入地擁抱開源。20多年前,沒有人會想到開源一詞可以寫入政府的“十四五”規劃。
來自于中國的開源項目、開源系統也在嶄露頭角,比如:首個國人主導的Apache頂級項目Kylin、百度的飛槳、分布式關系型數據庫TiDB、小米自研移動端深度學習框架MACE、物聯網大數據平臺TDengine、曠視深度學習開源框架天元、一流科技OneFlow,還有OceanBase等等。
令人興奮地是,自2018年開始中國連續多年成為GitHub貢獻排名第二的國家,充分展示了中國技術人的勤奮、創新和創造力。
二、被誤解的開源:在發展中出現的亂象
不過,雖然大家都在深度地擁抱開源,但對開源的理解存在方方面面的不同。
較為可惜的是,如果對開源理解不深或者比較片面的話,就可能做不好開源、也享受不到開源帶來的長期好處,甚至因為某方面的好處而舍本逐末。比較典型的幾種觀點有:
- “開源本質上就是一個軟件分發的手段”。至于其他部分,創新或協作模式都不重要;
- “開源主要是一種用戶增長的渠道”。利用開源誘惑大家使用其軟件,達成用戶增長的目標;
- “開源是一種提升公司估值的噱頭”。過度看重用開源提高公司估值;
- “開源是一種快速盈利的商業模式”。因此會更糾結于如何逐利,忽視開源的本質;
- “開源是一種提升技術品牌的方法”。固然企業擁抱開源的確有助于打造技術品牌,但有的企業并沒有想清楚怎么打造開源社區,不明白開源對于開發者的意義,只是在愿景驅使下為了開源而開源。
這些觀點多少都有失偏頗,因此也造成了一些令人惋惜的現象。
舉幾個例子:
第一,在GitHub數目的運營上,有些企業會蓄意騙star的數量。但事實上,一個開源軟件系統的成與敗,不是靠一個有水分的star數目來決定的。
第二,“我開源,你來用”。開源強調更多的是共建,而不是居高臨下,要求你來用我開源的東西或你加入我的生態。這實質反映了一種對于開源項目和開源生態的控制欲。
第三,缺乏合作共建,很多企業看到另外一家企業開源了某系統,就會升起攀比心,想著我也要做一個,甚至是我能比它做得更好,因此頻頻另起爐灶,重復造輪子。
第四,開源利益的沖突。MongoDB與AWS之間的矛盾沖突就是典型的例子。
在各方擁抱開源的大背景下,我們可以看到,不僅各大企業之間缺乏協同,學術界和企業之間也缺乏協作。如果看不到開源真正的本質的話,開源運動就不可能真正在中國的國土上興盛起來。值得反思的是,盡管我們在GitHub上的貢獻連續多年位列全球第二,但是來自于中國的真正具有強大國際影響力的的開源項目有多少呢?是什么造成了這種落差呢?
我認為,這主要歸咎于很多人對開源的理解不足,無論是從理念、文化還是到具體的打法上,都有一些欠缺。
“拿來主義”。我們今天拿來主義還是存在的,沒有貢獻,沒有回饋社區,拿來即用。這就是不理解開源之道,也不懂得開源打法。
“缺乏共享”。有的是不知道共享或者不愿意共享;有的是有意愿共享,但往往因為工作壓力、缺乏時間等理由懶得共享;還有的是愿意共享也主動去共享,但長時間停留在不被社區接受的階段。
“不夠開放”。為開源而開源,不能長期投入,還有過強的“控制欲”,都會造成開源系統做不大、做不久。
在開源之法上,如果堅持開放共享,與社區共同成長,長期享受開源紅利,則是相對健康的開源發展模式。反之,如果是選擇封閉開發,也許會在短期受益,但最終會被社區拋棄,這種短視的發展模式比較致命。
還有一些現象也會限制開源運動的發展:過度地“趨利”和“趨名”,對開源來說是欲速則不達;開源巨頭形成的“技術寡頭壟斷”同樣會在某種程度上扼制開源生態的茁壯成長;代碼開源但項目管理是“閉源”的,也不利于開源運動的快速發展。
三、挑戰重重:重新回歸開源的本質
開源運動在今天面臨各種各樣的挑戰,可能會走很多彎路。早在幾年前,我就提到是時候重新思考開源的本質了,思考當年GNU時代的快速興起。當時我比較了自由軟件和開源軟件,我覺得自由軟件更加貼近開源的本質,開源讓企業和商業公司擁抱它,但商業慢慢地在扭曲自由軟件帶來的開源的本質。
回顧一下GNU快速興起的時代,當時我特別喜歡GDB、GCC,喜歡Emacs。當時的自由軟件是如此的純粹,以致于可以盡情領略早期通過開源模式來打造共享創新平臺的魅力。在GNU土壤上長出的Linux就是一個典例,Linus當時根本沒有想過要做商業公司盈利,只是出于愛好要做一個自己可控可玩的UNIX系統,因此Linux平臺才能一步步從最初發展到如今龐大的生態。
2019年,我們把Kaldi 之父 Daniel Povey引入小米,靠的主要就是小米對開源的深度擁抱。到中國之后,Povey強調最多的是,他想為中小微企業打造一個免費的、功能強大的、性能卓越的語音識別工具集 Kaldi。他不追求名利,他追求的是比較極致的開源。我們當時就達成了共識:做開源,我們要讓Kaldi這個系統、小米、所有創業企業,以及所有用這個社區的人達成多方共贏。
今天我們要回歸開源,我認為開源的本質在于:開放、共享、平等、協同、創新。
開源作為一個很好的創新平臺,應該強調更多的是利他主義和長期主義。相較于為己爭利,要更多地去考慮能不能和大家一起共建,更注重利他;相較于短視地追求利益,放棄急功近利的思想,更注重時間的沉淀和積累。
最近在讀《論語》,其中有兩句話讓我深有感觸。一是“德不孤,必有鄰”,做開源如果一開始就秉承開源之道,不用擔心沒有志同道合的人,很多人會跟你一起共建;二是“道不同,不相為謀”,如果太注重私利,那么久而久之,沒有人愿意跟你一起共建,這個開源項目可能就很難做大。
四、開源與技術創新
簡單聊一下開源與技術創新。從GNU到Linux,到安卓,再到移動互聯網,這代表開源帶來的創新,沒有這些,就沒有今天手機上的很多的東西。
開源和創新有什么關系呢?美國著名的社會學家、科學社會學的奠基人羅伯特·金·默頓在他所寫的《站在巨人的肩膀上》一書中,總結了現代科學的精神特質(科學道德觀/范式):普遍主義、公有主義、無私利性和有組織的懷疑主義。這種理念與開源的本質是非常吻合的,時至今日也不過時。
過去我們做研究、寫論文、發表文章,沒有互聯網,就要到圖書館查文獻,翻閱紙質的書。但今天我們有arXiv,還有Papers With Code。隨著AI的發展,基于開源的創新形成了一種平衡,一篇文章是文檔的code,還是帶代碼的paper?區別不大。
如果大家相信軟件定義一切,也同意AI賦能萬物的話,想必也會贊成我的這一觀點:在互聯網、大數據和人工智能時代,開源是人類技術進步的最佳平臺和模式。開源不僅僅是一個軟件分發的工具,也不只是一個商業模式,它是真正可以幫助我們創新,幫助我們協作,讓所有技術進步的非常重要的平臺和模式。