除Kaggle外,還有哪些頂級數據科學競賽平臺
在數據科學圈晃蕩的小伙伴,很少有不知道Kaggle的。Kaggle不僅是一個競賽平臺,也提供了非常好學習機會。通過比賽,你可以接觸先進的方法和數據集、可以與志同道合的人一起參賽,最重要的是能夠向全世界展示你的才華。
除了Kaggle,其實還有不少類似的平臺,下面文摘菌就給大家盤點一下這些競爭數據科學平臺。
DrivenData
DrivenData主要舉辦的是數據科學類競賽,通過前沿的預測模型,解決世界上最棘手問題,建立一個更美好的世界。通過舉辦數據科學競賽來發揮數據在國際發展,健康,教育,醫療等社會問題中的作用。參賽者可以自己參加比賽或者發布比賽項目。
平臺地址:https://www.drivendata.org/
該平臺有一個專門的案例分析部分,以案例研究的形式提供一些成功項目的信息。DrivenData中列出的數據集與非營利組織相關,范圍從野生動物保護到公共健康。因此,如果你想將數據技能應用于實際問題,DrivenData是一個很好的選擇。
CrowdANALYTIX
CrowdANALYTIX是一個眾包分析平臺,他們將商業挑戰和業務問題轉化為競賽。參賽者可以在CrowdANALYTIX社區內通過合作或競爭來構建和優化AI,ML,NLP和深度學習算法的項目。該平臺還擁有一個社區博客,其中包含大量資源,包括訪談和參考資料。
- 平臺地址https://www.crowdanalytix.com/community
- 社區博客:https://www.crowdanalytix.com/jq/communityBlog/listBlog.html
InnoCentive
InnoCentive 是一家開放式創新型的研究公司。最早是由醫藥制造商禮來公司資助,創立于2001年,最初的職能是化學和生物領域的研發供求網絡平臺。服務于190多個國家,為390000人提供相關服務。
該平臺主要專注于處理生命科學的問題,但研究領域也包括數學、物理、化學、工程、計算機科學等。參與者需要具有批判性的思維、研究力、創造力、和多學科知識的交叉來解決平臺上的實際問題。提出解決方案不僅是一次非常好的能力鍛煉,同時也可以獲得相應的報酬。
平臺鏈接:https://www.innocentive.com/our-solvers/
TundIT
TunedIT最初是華沙大學的一個科學博士項目。目標是幫助數據科學家進行可重復的實驗的,并輕松評估數據驅動的算法。隨后,創始團隊為了教育研究、科學實驗和一些商業目的開發了TunedIT Challenges平臺,用于舉辦此類的數據競賽。
平臺鏈接:
https://towardsdatascience.com/top-competitive-data-science-platforms-other-than-kaggle-2995e9dad93c
Codalab
Codalab是一個開源的基于Web的平臺,它使研究人員,開發人員和數據科學家能夠在同一平臺上進行協作,目標是推進使用機器學習和高級計算領域的研究。CodaLab通過其在線社區幫助解決了許多數據導向研究領域的常見問題。平臺既支持參加現有的比賽,也支持舉辦新的比賽。
平臺鏈接:https://competitions.codalab.org/
Analytics Vidhya
Analytics Vidhya 是一個為分析師和數據科學專家區提供的知識社區。除了為數據科學分析提供大量資源外,平臺的Hackathons旨在解決一些工商業界存在的實際問題,并通過競賽的形式發布。在這個平臺上,你既可以參與挑戰,也可以贊助比賽。很多在Analytics Vidhya組織Hackathons挑戰的大公司也會為優秀的參賽者提供工作機會。
平臺鏈接:https://datahack.analyticsvidhya.com/?utm_source=main-logo
CrowdAI
數據科學挑戰平臺crowdAI每年都會面臨多項開放數據科學挑戰。挑戰包括圖像分類,文本識別,強化學習,對抗性攻擊,圖像分割,資源分配優化以及跨領域問題。這個平臺曾在亞馬遜和Nvidia獲得了超過10萬美元,然后發布稱為“Learning to Run”的競賽。
- crowdAI:https://www.crowdai.org/challenges
- Learning to Run:https://www.crowdai.org/challenges/nips-2017-learning-to-run
Numerai
Numerai是由AI運行,是一群對沖基金圈的數據科學家建設。每周舉辦一次數據科學競賽,為真正的對沖基金提供支持。Numerai每周向其參與者提供加密數據,然后參與者提交預測模型。然后,Numerai從其所有提交中創建一個元模型并進行投資。如果投資有收益,數據科學家提交的預測可以換取加密Blockchain令牌。
平臺鏈接:https://numer.ai/rounds
天池
天池是阿里云的數據競爭平臺,在很多方面類似于Kaggle。這是一個由數十萬數據科學家相互合作并與全球企業和政府聯系以解決各行業最棘手的業務問題的社區。
平臺鏈接:https://tianchi.aliyun.com/competition/gameList/activeList
大數據專家、阿里巴巴集團副總裁涂子沛介紹,比賽中勝出的優秀數據模型,不僅可用于參賽者的學術研究成果,還有機會走出實驗室,直接應用于淘寶、 支付寶等真實的商業場景,影響中國乃至世界數以億計的用戶。
Data Science Challenge
平臺上的數據科學挑戰是由英國政府部門贊助,包括國防科學技術實驗室(Dstl)、政府科學辦公室,SIS和MI5在內多個政府部門。這些挑戰旨在鼓勵數據科學領域最聰明的人才幫助解決現實問題。目前,該平臺提供的兩個挑戰已經結束,但仍會有源源不斷的問題等待者挑戰者去解決。
平臺鏈接:https://www.datasciencechallenge.org/
KDD Cup
KDD Cup是由ACM特別興趣小組組織的年度Data Mining 和Knowledge Discovery競賽。2019界SIGKDD將于2019年8月4日至8日在美國阿拉斯加州安克雷奇舉行。 KDD杯比賽預計將持續2-4個月,獲勝者將在2019年7月中旬通知。
今年的三個競賽課題為:
- 常規機器學習競賽軌道(常規ML軌道)
- 自動機器學習競賽軌道(Auto-ML Track)
- “人文研究”強化學習競賽軌道(Humanity RL Track)
平臺鏈接:https://www.kdd.org/kdd2019/kdd-cup
相關報道:
https://towardsdatascience.com/top-competitive-data-science-platforms-other-than-kaggle-2995e9dad93c
【本文是51CTO專欄機構大數據文摘的原創譯文,微信公眾號“大數據文摘( id: BigDataDigest)”】