Github發布Octoverse開源報告!印度將超美國成最大開發者社區,生成式AI增長248%,Copilot重構GitHub
一年一度的GitHub Octoverse開源社區狀態報告又出爐了。
毫無疑問,今年的報告主題是圍繞生成式AI展開的。生成式人工智能項目總數同比增長達到瘋狂的248%!
越來越多的開源維護者采用了生成式AI工具,近三分之一的星標項目的維護者在使用GitHub Copilot。
全球開發者社區繼續快速增長,預計印度將在2027年超過美國成為GitHub上最大的開發者社區。
新加坡、巴西、阿根廷和哥倫比亞是增長最快的地區。
人工智能技術正在主流化,更多開發者在實驗AI模型,如ChatGPT API。開源AI創新多樣化,多由個人開發者貢獻。
基礎設施即代碼(IaC)繼續增長,開發者將云部署過程標準化程度越來越高。
TypeScript超過Java成為第三流行語言,顯示其在開發者中越來越受歡迎。Rust由于其內存安全和效率繼續吸引大量開發者。
當AI成為主流的一年
新技術成為主流意味著什么?
Git于2005年面世,在GitHub剛成立時,它還是一個開源版本控制系統。如今,Git已成為現代開發者體驗的基礎設施,93%的開發者使用它來構建和部署軟件。
如今,GitHub的數據指向了另一項重塑開發人員體驗的技術:人工智能。
在過去的一年里,越來越多的開發者開始使用人工智能幫助自己開發,同時也在嘗試構建人工智能驅動的應用。
Git已經從根本上改變了當今的開發者體驗。而現在,人工智能正在成為軟件開發的新一代基礎設施。
如今在GitHub上,開發人員喜歡在實踐中學習,而開源可以幫助開發人員更快地采用新技術,將其集成到工作流程中,構建新技術,新產品。
開源還為幾乎所有現代軟件提供了動力,成為了數字經濟的助推器。
今年Octoverse報告的主題是,研究人工智能、云計算和Git的開源活動如何改變了開發者的體驗,討論這些技術如何在開發者和企業中產生越來越大的影響。
軟件開發領域的三大趨勢:
開發人員正在大量使用生成式人工智能
越來越多的開發人員正在嘗試使用OpenAI和其他人工智能公司的基礎模型,開源的生成式人工智能項目甚至在2023年進入了按貢獻者數量排名的十大最受歡迎的開源項目。
幾乎所有開發人員(92%)都在使用或嘗試使用人工智能編碼工具,Github預計開源開發人員將推動GitHub上人工智能創新的下一波浪潮。
開發人員正在大規模運行云原生應用程序
使用基于Git的基礎設施即代碼(IaC)工作流的聲明式語言越來越多,云部署的標準化程度越來越高,開發人員使用Dockerfiles,容器,IaC以及其他云原生技術的比例也急劇上升。
2023年的首次開源貢獻者人數最多
商業支持的開源項目占據了首次貢獻者和總體貢獻的最大份額,但今年,生成式人工智能項目進入了首次貢獻者最受歡迎的十大項目之列。
GitHub上私有項目的增長顯著,同比增長38%,占GitHub上所有活動的80%以上。
在GitHub上構建全球開發者社區
在全球范圍內,使用GitHub開發軟件和開展協作的開發者人數比以往任何時候都多,而且囊括了公共項目和私人項目。
這不僅證明了Git在當今開發者體驗中的重要價值,也顯示了使用GitHub構建軟件的全球開發者社區有多么龐大的規模。
美國擁有2020萬開發者,開發者人數在去年增長了21%,仍然是全球最大的開發者社區。
但自2013年以來,其他社區在整個平臺上的高速增長。預計這種情況還將持續。
GitHub上的全球開發者分布圖顯示了不同地區的開發者數量。
亞太地區、非洲、南美洲和歐洲的開發者社區規模逐年擴大,其中印度、巴西和日本處于領先地位。
未來五年十大開發者社區預測
預計到2027年,印度將超過美國,成為GitHub上最大的開發者社區。
亞太地區增長最快的開發者社區
在印度、日本和新加坡等經濟中心的推動下,亞太地區的增長非常可觀。
印度的開發者社區繼續保持著巨大的同比增長,以下是他們在GitHub上創建和貢獻的開源軟件(OSS)項目列表。
新加坡是亞太地區今年開發者人口增長最多的國家,也是全球開發者與總人口比例最高的國家。
由于日本在技術和初創企業方面的進一步投資,明年日本的開發者將有持續增長。
非洲發展最快的開發者社區
非洲地區是世界上人口增長最快的地區,開發人員的數量也在不斷增加,因此被認為是技術公司大有可為的中心。(在肯尼亞,編程是中小學的必修課)。
尼日利亞是采用開放源碼軟件和進行技術投資的熱點地區,45%的年增長率為全球最高。
GitHub上還有至少200個由尼日利亞開發人員開發的項目,可以在「非洲制造 」系列中找到。
南美洲發展最快的開發者社區
南美洲開發者的增長率與亞太地區和非洲一些增長最快的開發者社區不相上下。
2023年,巴西的開發人員數量是南美地區最多的,并將繼續以兩位數的速度保持增長,同比增幅達30%。
阿根廷和哥倫比亞的持續增長,這兩個國家在過去幾年中已成為各組織的熱門投資目的地。
歐洲發展最快的開發者社區
歐洲各社區的開發者人口總數也在繼續增加,但其發展與美國的總體情況更為接近,增長速度不如亞太,非洲等地區。
值得注意的是,法國的增長是在政府推動吸引更多科技初創企業之后實現的。西班牙和意大利的增長也在上升,這說明這兩個地區在努力加強其國內技術市場。
2023年生成式人工智能的爆炸式增長
雖然生成式人工智能在2023年的新聞頭條中才大放異彩,但對于GitHub上的開發者來說,這項技術早就不陌生了。
在過去幾年中,GitHub上出現了多個生成式人工智能項目,還有很多其他以人工智能為重點的項目。
但2023年的GitHub數據反映了這些人工智能項目是如何從更專業的工作和研究發展到更主流的應用,開發人員越來越多地使用預訓練模型和API來構建生成式人工智能驅動的應用。
2023年剛剛過半的時候,生成式人工智能項目數量就是2022年全年的兩倍多。
而且就算是這個數量,在未來看來,也只是冰山一角。
隨著越來越多的開發人員嘗試使用這些新技術,預計他們將推動軟件開發領域的人工智能的進一步創新,并繼續將該技術大幅增長的能力帶入主流視野之中。
開發人員越來越多地嘗試使用人工智能模型。過去幾年,開發人員使用 tensorflow/tensorflow、pytorch/pytorch等機器學習庫構建項目。
現在,更多的開發人員在嘗試使用人工智能模型和LLM,如ChatGPT API。
預計企業和組織也會利用預先訓練好的人工智能模型,尤其是當越來越多的開發人員熟悉使用這些模型進行構建時。
開源人工智能創新多種多樣,頂級人工智能項目由個人開發者擁有。
分析GitHub上排名前20位的開源生成式人工智能項目,其中一些頂級項目是個人所有。
這表明,GitHub上的開源項目會繼續推動創新,并展示行業的下一步發展趨勢,而開源社區也將圍繞最激動人心的進步不斷發展。
生成式人工智能技術本身正推動個人貢獻者在生成式人工智能項目的貢獻大幅飆升,同比增長幅度達到了驚人的148%。而生成式人工智能項目總數也同比增長248%。
值得注意的是,美國、印度和日本在開發者社區中處于領先地位,其他地區包括香港地區、英國和巴西緊隨其后。
學習生成式人工智能的開發人員數量的大幅上升將對企業產生影響。
隨著越來越多的開發人員熟悉構建生成式人工智能驅動的應用程序,預計人才庫將不斷擴大。那些尋求開發自己的人工智能驅動產品和服務的企業將會有更多的選擇。
在過去的一年里,在ChatGPT等基礎模型之上構建的應用程序呈指數級增長。
開發人員使用這些LLM開發面向用戶的工具,如API、機器人、個人助手、移動應用程序和插件。
全球的開發人員正在幫助為主流應用奠定基礎,而實驗正在幫助企業建立人才庫。
最流行的編程語言
自2019年云原生開發大規模增長以來,IaC在開源領域持續增長。
2023年,Shell和Hashicorp配置語言(HCL)再次成為開源項目中的頂級語言,這表明運營和IaC工作在開源領域的地位日益突出。
- HCL的采用率同比增長了36%,這表明開發人員正在為其應用程序使用基礎設施。
- HCL的增加表明,開發人員越來越多地使用聲明式語言來決定如何利用云部署。
JavaScript再次榮登最受歡迎語言的榜首,而Python和Java等我們熟悉的語言也繼續保持在前五位。
TypeScript廣受歡迎,用戶數量增長了37%,首次超過Java,成為GitHub上開源軟件項目中第三受歡迎的語言。
TypeScript于2012年推出,集語言、類型檢查器、編譯器和語言服務于一身,它允許開發人員在代碼中采用不同程度的靜態和動態類型。
用于數據分析和操作的流行語言和框架顯著增加。
T-SQL和TeX等古老的語言在2023年有所增長,這凸顯了數據科學家、數學家和分析師如何越來越多地使用開源平臺和工具。
與GitHub上最流行的語言相比,2023年創建的項目中最流行的語言,與GitHub上最流行的語言總體相當。
一些值得注意的異常值包括Kotlin、Rust、Go和Lua,它們在GitHub上較新的項目中出現了較大的增長。
Rust持續增加
在業界領袖對Rust應如何進行系統編程發表評論,以及Rust被納入Linux內核之后,Rust繼續吸引著越來越多的開發者。
雖然與其他語言相比,它的總體使用率較低,但卻以每年40%的速度增長,并在2023年Stack Overflow開發人員調查中連續第八年被評為最受推崇的語言。
Rust和Lua都以內存安全和高效著稱,而且都可用于系統和嵌入式系統編程,這也是它們增長的原因。而Go最近的增長是由Kubernetes和Prometheus等云原生項目推動的。
開發者活動是新技術應用的風向標
2023年初,GitHub迎來了一個里程碑,開發者超過了1億人。
而且自去年以來,GitHub上的全球開發者賬戶數量增長了近26%,比以往任何時候都有更多的開發者跨時區協作并構建軟件。
開發者在私有和公共資源庫中的活動凸顯了哪些技術正在被廣泛采用,以及哪些技術正準備被更廣泛地采用。
開發人員正在將更多的工作流程自動化。在過去一年中,開發人員使用GitHub Actions自動執行公共項目任務、開發CI/CD管道等的時間增加了169%。
- 開發人員平均每天在公共項目中使用超過2000萬分鐘的GitHub Actions。隨著GitHub Marketplace的GitHub Actions數量在2023年突破20,000大關,社區規模還在不斷擴大。
- 這表明開源社區對CI/CD自動化和社區管理的認識在不斷提高。
GitHub 80%以上的貢獻都是對私有資源庫的貢獻。私人項目的貢獻超過42億次,公共和開源項目的貢獻超過3.1億次。
事實上,在最近由GitHub發起的一項調查中,所有開發人員都表示,他們的公司至少采用了一些內部源代碼實踐,超過一半的人表示,他們的組織中存在活躍的內源文化。
GitHub是開發人員運行和擴展云原生應用程序的地方。
2023 年,430萬個公共和私有軟件源使用了Dockerfile,超過100萬個公共軟件源使用Dockerfile創建容器。
在此之前,Terraform和其他云原生技術的使用在過去幾年中不斷增加。越來越多地采用IaC實踐也表明,開發人員正在為云部署帶來更多標準化。
生成式AI進入GitHub Actions。從GitHub Marketplace中300多個由AI驅動GitHub Actions和30多個由GPT驅動的GitHub Actions中可以明顯看出,人工智能在開發者社區中的早期應用和協作能力。
開發人員不僅繼續嘗試使用人工智能,還通過GitHub市場將其引入開發人員體驗的更多部分及其工作流程中。
AI將如何改變開發者的體驗?
92%的開發人員已經在工作內外使AI編碼工具。這是GitHub發起的2023年開發人員調查的重要發現之一。此外,81%的開發人員認為,人工智能編碼工具將使他們的團隊更具協作性。
在調查中,開發人員表示,協作、滿意度和工作效率都將從人工智能編碼工具中得到提升。
底線:開發人員嘗試新技術,并在公共和私有資源庫中分享他們的學習成果。這種相互依存的工作讓容器化、自動化和CI/CD的價值浮出水面,從而在開源社區和公司之間打包和發布代碼。
開源代碼的安全情況
今年,開發人員、開放源碼軟件社區和公司都在利用自動警報、工具和前瞻性安全措施更快地應對安全事件,這有助于開發人員更快地獲得更好的安全成果。
越來越多的開發人員正在使用自動化來確保代碼安全。
與2022年相比,2023年開放源代碼開發人員,針對易受攻擊軟件包的自動化Dependabot拉取請求增加了60%。
得益于GitHub上的免費工具(如Dependabot、代碼掃描和秘密掃描),各開源社區的開發人員正在修復更多的易受攻擊軟件包,并解決代碼中的更多漏洞。
越來越多的開源維護者開始保護他們的分支。
受保護的分支為維護者提供了更多確保項目安全的方法,超過60%最受歡迎的開源項目在使用它們。
今年早些時候,GitHub的GA中推出了版本庫規則,因此大規模管理這些規則將變得更加容易。
開發人員正在GitHub上分享負責任的人工智能工具。在生成AI時代,人工智能信任和安全工具是發展趨勢。
開發人員正在圍繞負責任的人工智能、人工智能中的公平性、負責任的機器學習和道德人工智能創建和共享工具。
開源代碼現狀
2023年,開發人員為GitHub上的開源項目做出了3.01億次貢獻,這些項目既有像Mastodon這樣的熱門項目,也有像Stable Diffusion和LangChain這樣的生成式人工智能項目。
商業支持的項目繼續吸引了一些最開放的源代碼貢獻,但2023年是生成式AI項目首次進入GitHub上最受歡迎的10大項目之列的第一年。
說到生成式AI,在至少有一個星級的開源項目中,幾乎有1/3的項目的維護者正在使用 GitHub Copilot。
商業支持項目繼續領先。2023年,按貢獻者總數計算,最大的項目絕大多數由商業支持。
這一趨勢在去年得到了延續,microsoft/vscode、flutter/flutter和vercel/next.js在2023年再次躋身前十名。
生成式AI在開源和公共項目中發展迅速。
2023年,基于生成式AI的開源軟件項目,如langchain-ai/langchain和AUTOMATIC1111/stable-diffusion-webui,是躍居GitHub上貢獻者數量最多的項目。
越來越多的開發人員正在利用預訓練好的AI模型構建LLM應用程序,并根據用戶需求定AI應用程序。
開源維護者正在采用生成式AI。在至少有一個星級的開源項目中,1/3的維護者都在使用GitHub Copilot。
這是繼GitHub向開源項目維護者免費提供GitHub Copilot之后的又一舉措,表明生成式AI在開源項目中的應用日益廣泛。
30%《財富》百強企業有OSPO
開源項目辦公室(OSPO)鼓勵企業參與和遵守開源。
根據Linux基金會的數據,自2022年以來,全球公司采用OSPO的比例增加了32%,72%的公司計劃在未來12個月內實施OSPO或開放源碼軟件計劃。例如,微軟、谷歌、Meta、Comcast、摩根大通和梅賽德斯奔馳等公司都擁有OSPO。
GitHub在2021年成立了OSPO,并開源了github-ospo,以分享資源和見解。
與此同時,開發者看到了組合使用軟件包和容器化的好處。
正如之前提到的,2023年有430萬個軟件源使用了Docker。另一邊,Linux發行版NixOS/nixpkgs在過去兩年中一直位居開源項目貢獻者榜首。
新加入的開源項目貢獻者仍然更偏向選擇那些由知名商業公司支持的項目。
去年,GitHub發現,與其他項目相比,由商業支持的熱門項目的品牌知名度吸引了更多的首次貢獻者。
這種情況在2023年仍將繼續,在首次貢獻者中最受歡迎的一些開源項目由微軟、谷歌、Meta和Vercel支持。
但是,從home-assistant/core到AUTOMATIC1111/stable-diffusion-webui、langchain-ai/langchain和Significant-Gravitas/Auto-GPT等社區驅動的開源項目,也出現了來自首次貢獻者的活動激增。
這表明,對基礎模型的開放式實驗提高了生成式AI的可及性,為新的創新和更多合作打開了大門。
2023年,首次為開源項目做出貢獻的人數最多。
新開發人員通過freeCodeCamp、First Contributions和GitHub Education等項目加入了開源社區。
其他值得關注的趨勢
- 專注于前端開發的開源項目持續增長。vercel/next.js和nuxt/nuxt(按貢獻者增長情況排在前40位的項目)的持續增長。可以看到,更多開源和公共項目的開發人員參與到前端開發工作中。
- 開源家庭自動化項目home-assistant/core再次榮登貢獻者榜首。自2018年以來(2021年除外),該項目幾乎每年都在榜單上名列前茅。它的持續走紅顯示了項目社區建設工作的實力。
底線:開發人員正在為開源生成式AI項目做出貢獻,開源維護者正在采用生成式AI編碼工具,公司繼續依賴開源軟件。
這些都表明,在開放環境中學習并分享新技術實驗成果的開發人員能夠提升整個全球開發人員網絡,無論他們是在公共還是私有資源庫中工作。
三點啟示
正如Git已成為當今開發人員體驗的基礎一樣,GitHub現在也看到了AI成為主流的證據。
僅在過去一年,就有92%的開發人員表示,在工作內外使用過基于AI的編碼工具。同時,GitHub上的各種開源項目也出現了AI實驗的爆炸性增長。
- GitHub是生成式AI的開發者平臺。
2023年,生成式AI從一個專業領域發展成為主流技術,開源活動的爆炸式增長也反映了這一點。隨著越來越多的開發者開始構建和嘗試生成式AI,他們正在使用GitHub進行協作和集體學習。
- 開發人員正在GitHub上大規模運行云原生應用程序。
2019年,在開源領域使用基于Docker技術的開發人員數量大幅躍升,而且開發人員越來越多地使用基于Git的IaC工作流、docker編排和其他云原生技術的速度在2023年也急劇上升。這一巨大的活動量表明,開發人員正在使用GitHub來規范他們如何將軟件部署到云中。
- GitHub是開源社區、開發人員和公司構建軟件的平臺。
2023年,私有資源庫的數量增長了38%,占GitHub所有活動的81%。同時,使用GitHub構建下一代軟件并推動行業發展的開源社區仍在持續增長。數據顯示,新的開源開發者在增加,開放社區的創新步伐也在加快,很顯然,開源從未如此強大。