促進生信領域交流,共建開源開放生態,CCF 開源創新大賽暨第二屆 Bio-OS 開源開放大賽圓滿落幕
原創在生物信息學領域,每一次探索都可能觸及新的領域,每一次的合作都可能孕育出創新的火花。
為了促進生信領域的交流與合作,共建“開放、創新、合作、共贏”新生態,在中國計算機學會和廣州實驗室指導下,火山引擎和 Intel 聯合發起 CCF 開源創新大賽暨第二屆 Bio-OS 開源開放大賽。大賽以“開源共贏,科學無限”為宗旨,構建 Bio-OS 社區的開源生態。
11 月 12 日,CCF 開源創新大賽暨第二屆 Bio-OS 開源開放大賽圓滿落幕。本屆大賽共有297支團隊參賽。在激烈的決賽中,“樂想事成”團隊在6支參賽隊伍中脫穎而出,榮獲“論文復現賽道”的冠軍;“綠瓦生信”團隊在5支參賽隊伍中一馬當先,奪取“任務挑戰賽道”第一名;“抗體三次方”團隊憑借實力,戰勝了10支參賽隊伍,在“AI 算法賽道”中摘得桂冠!
Bio-OS 開源開放大賽不僅是一場競賽,更是一個集結智慧、激發創新、促進合作的交流平臺,參賽者們不僅有機會展現自己的才智,還能與其他優秀人才交流思想、碰撞火花。那么本次參賽選手都有哪些收獲呢?
群英薈萃,啟迪生信創新靈感
本屆大賽吸引了眾多來自高校和企業的優秀選手,他們參與比賽的主要動力在于嘗試運用理論知識、挑戰自我,還有的選手則是與 Bio-OS 開源開放大賽不期而遇。
獲得論文復現賽道一等獎的“樂想事成”團隊和 AI 算法賽道二等獎的“Better++”團隊均由高校學生組成,他們選擇了與自己專業相關的賽道,想要嘗試將理論知識應用于實踐,以此增強實操技能。
有些選手則是因為偶然的機會與 Bio-OS 開源開放大賽結緣。AI 算法賽道一等獎的“抗體三次方”團隊在網絡平臺上了解到了 Bio-OS 開源開放大賽,并被其挑戰性所吸引,因此選擇參賽;任務挑戰賽二等獎的“嶄晴生物”團隊則是在第十屆計算生物學大會 NCCBB 中,偶然與火山引擎的參展商進行交流后被鼓勵參賽。
此外,也有選手是第二次參加比賽。陳哲名所在的“且行之隊”獲得了論文復現賽道三等獎,也是第二次參賽的選手,他表示參賽主要是為了克服自己的惰性,同時也想學習優秀作者的科研思路,而 Bio-OS 開源開放大賽正好提供了這一渠道和機會。論文復現賽道二等獎“堿基跳動”團隊的陳宗貴同樣也是第二次參賽,他表示去年參賽的成績不理想,所以今年選擇重振旗鼓。而在今年的比賽中,他發現 Bio-OS 平臺新增了開發者模式,為構建流程的開發者提供了便利。
自我突破,將經驗融入未來科研道路
本次大賽共有三個賽道,每個賽道都有不同的難點。而選手們不僅克服了賽道中的難點,還克服了時間緊、工作與比賽沖突、不了解 Bio-OS 平臺等難題,實現了自我突破。
在論文復現賽道中,理解論文的核心思路并補充缺失的代碼對于參賽選手來說是最大的挑戰。“且行之隊”和“堿基跳動”團隊認為,論文提供的源代碼非常有限,所以需要根據花費大量的時間和精力理解文章。然而,在克服這一困難后,選手們發現自己不僅學習了頂尖作者的科研思路和經驗,對工作或學習有幫助,還增強了對標準化和平臺化的認識。
任務挑戰賽需要參賽團隊打造集成生物信息分析的智慧應用。開發應用則需要開發者以用戶需求和體驗為先,重視工作流程的搭建和操作文檔的編寫,從而提高應用的可用性。“嶄晴生物”團隊在比賽中意識到了這一點,他們致力于構建以用戶體驗為先的工作流程。這一策略不僅幫助他們在比賽中取得了優秀的成績,也讓他們學會了如何在未來的工作中更有效地滿足用戶需求,提供更優質的服務。
除了與時間賽跑和攻克賽題的難點,團隊合作同樣是取勝的關鍵因素之一。實際上,團隊間的協作比單個成員的能力更為關鍵,這要求每位成員不僅要發揮自己的專長,還要相互支持,攜手面對挑戰,共同克服困難。“樂想事成”團隊和“抗體三次方”團隊正是掌握了這一訣竅,使得團隊分別榮獲論文復現賽道和 AI 算法賽道的一等獎。
指導老師的幫助對于他們來說也同樣重要。“樂想事成”團隊的指導老師是杜萌澤,杜萌澤老師在整個暑假期間監督團隊打卡和匯報進度,同時指出問題并提供指導。“抗體三次方”團隊則表示,隨著模型變得越來越大,算力成為了一個瓶頸。為了鼓勵和支持他們參加比賽,北京協和醫院為他們提供了高性能計算平臺,北京協和醫學院的王曉月教授也給予了寶貴的幫助和專業的指導。
Bio-OS 平臺賦能,點亮科研道路的新火花
Bio-OS 平臺在本次大賽中扮演了核心的支撐角色,為參賽選手帶來了諸多便利。參賽者普遍對 Bio-OS 平臺的使用體驗給予了積極的評價,他們認為 Bio-OS 平臺不僅在比賽過程中發揮了重要作用,而且對生信領域的科研活動也具有深遠的意義。
“且行之隊”“樂想事成”和“堿基跳動”團隊認為,Bio-OS 平臺的流暢性、穩定性以及資源調用的靈活性對于比賽有很大的幫助。在處理大量數據時,Bio-OS 平臺能夠在保障穩定和流暢的同時,根據數據處理的不同階段靈活調整資源配置,在參數設置上也能為用戶提供的多樣化選擇,為大規模數據處理提供了有力支持。此外,Bio-OS 平臺開源開放的特性對科研知識共享和傳播也具有重要意義,有助于推動科學界的知識公開和研究透明度。
而“抗體三次方”“Better++”和“嶄晴生物”團隊表示,Bio-OS 平臺是面向大眾、使用門檻低的平臺,它能夠封裝分析流程,讓不會編程的生物科學家快速上手復雜的分析工作,更無需關注運行環境、 Bug 等細節問題,從而大大降低科研工作的時間成本,提高科研效率。
在科研領域進入第五范式后,人工智能的應用變得愈發重要。在本次比賽中,“嶄晴生物”團隊利用了 Bio-OS 平臺鏈接的豆包大模型進行了生物學功能的注釋,為團隊提供了參考結果。他們認為,這只是大模型應用在生信領域的初步階段,隨著大模型的進一步迭代,未來或許可以在大模型中內置參數設置和用戶交互,實現代碼的自動生成和輸出,從而更好地實現可視化,幫助用戶選擇最佳的分析路徑,優化工作流程。
CCF 開源創新大賽暨第二屆 Bio-OS 開源開放大賽的圓滿落幕讓我們共同見證了科技與生物信息的碰撞,更感受到了生物信息學領域未來發展的強勁脈搏。每一位參賽者,每一個參賽團隊,都在比賽中收獲了寶貴的經驗,也推動了 Bio-OS 平臺在 AI4S 領域的應用。