五月GitHub最熱機器學習項目都在這里了
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
您的五月余額已不足,這個月最新最火的機器學習項目都看過了嗎?
Mybridge AI博客從將近250個機器學習開源項目中找到了標星數排名最靠前的Top 10項目,涵蓋視覺問答、對象檢測、自動生成評論等多個維度。
一起來看看吧~
第1名:Pythia
Pythia是Facebook人工智能實驗室出品的視覺和語言多模式研究的模塊化框架,2138星。
Pythia基于PyTorch,支持Model Zoo、多任務,有各種內置數據集比如VQA、VizWiz,支持基于DataParallel和DistributedDataParallel的分布式訓練,還可以實現高度自定義。

另外,拿Pythia來做TextVQA和VQA的入門代碼庫也不錯。
鏈接:
https://github.com/facebookresearch/pythia
第2名:云注釋(Cloud Annotations)
自定義對象檢測和分類訓練,2014星。
基于IBM云對象存儲,在TensorFlow上訓練,需要先在線進行圖像標注,macOS,Windows和Linux都可以用。
鏈接:
https://github.com/cloud-annotations/training
第3名:PySOT
商湯出品,可以在視頻里追蹤單個對象,實現SiamRPN和SiamMask等算法,1703星。



PySOT實現了最先進的單一對象跟蹤算法,包括SiamRPN和SiamMask等,用Python編寫,在PyTorch上運行。
鏈接:
https://github.com/STVIR/pysot
第4名:PyTorch-BigGraph
大規模圖形結構數據生成嵌入軟件,1417星,同樣也是Facebook出品,主要作者是巴黎的Luca Wehrstedt。
PyTorch-BigGraph是一個分布式系統,可以搞定多達數十億實體和數萬億邊緣的大型網絡交互圖形。
用PyTorch-BigGraph的話需要Python 3.6或更高版本,最低PyTorch 1.0,不需要投喂GPU,但是比較費CPU。
鏈接:
https://github.com/facebookresearch/PyTorch-BigGraph
第5名:InterpretML - Alpha
微軟出品,用來訓練可解釋的機器學習模型,1039星。
這里的“可解釋”指的是可以解釋模型調試中遇到的錯誤,模型有沒有搞歧視,如何讓人類理解這個模型,模型是否合法,在醫療、司法等高風險的領域靠不靠譜。
鏈接:
https://github.com/microsoft/interpret
第6名:Weights & Biases
可視化和追蹤機器學習實驗工具,1098星。
分析機器學習實驗,比TensorBoard更輕量級。每次運行時,可以保存超參數和輸出指標,訓練過程中能實現可視化模型,還能自動跟蹤代碼狀態,系統指標和配置參數。
鏈接:
https://github.com/wandb/client
第7名:MLIR
“多級中間表示”編譯器基礎結構,832星。
TensorFlow的一部分。MLIR旨在成為一種混合IR(intermediate representation),可以支持統一基礎架構中的多種不同要求,能夠表示所有TensorFlow圖,在TensorFlow圖上實現優化和轉換,用TensorFlow圖或者TF Lite完成量化和圖變換。
鏈接:
https://github.com/tensorflow/mlir
第8名:MeshCNN
PyTorch中三維網格的卷積神經網絡,367星。
這是SIGGRAPH 2019上發表的一篇論文,可以用來做3D形狀分割,作者來自以色列特拉維夫大學和亞馬遜。

類似傳統CNN,MeshCNN結合了在網格邊緣上運行的專用卷積和池化層。卷積應用于邊緣和它們的入射三角形的四個邊緣,池化層用邊緣折疊操作保留表面拓撲結構,給后面的層生成了網狀連接。
鏈接:
https://github.com/ranahanocka/MeshCNN
第9名:TensorWatch
微軟出品,用于深度學習和強化學習的調試,監控和可視化,299星。

TensorWatch是一款專為深度學習和強化學習而設計的debug和可視化工具。它充分利用Jupyter Notebook顯示實時可視化,不需要一直翻日志就能實時查詢訓練過程,還可以用來構建自己的UI和儀表板。
此外,TensorWatch利用幾個優秀的庫來可視化模型圖,審查模型統計,解釋預測等。
鏈接:
https://github.com/microsoft/tensorwatch
第10名:hncynic
一個獵奇項目,自動生成hacker news風格的評論,完全無視文章本身,看一眼標題,剩下全靠編,240星。
來源靠的是hacker news評論數據,借此訓練Transformer編碼器-解碼器模型,中途還順手用了一下維基百科的數據。
生成的評論大多腦洞清奇。
比如這個新聞標題《用TensorFlow檢測魚》,生成的評論是醬嬸的:
這篇文章太辣雞了。
1.為什么代碼看起來像一堆黑盒子標簽?我沒有看到它。
2.為什么你的模型不利用這些理論?為什么不是黑盒子分類器?
如果模型沒有取出紅盒子,它開始看到紅盒子,看起來像一個沒有明確顏色的黑盒子(看起來它知道藍色是什么)——它怎么能看到紅盒子,甚至能看出是黑盒子?
在一個不了解我們如何使用“黑匣子”和“藍盒子”來檢測真實環境中的魚類并使用黑匣子代替白紙盒的世界中,我們都知道這一點。
看起來好像很有道理的樣子,然而完全不知道在說啥,而且是滿滿的杠精畫風啊!
鏈接:
https://github.com/leod/hncynic
傳送門
原文鏈接:
https://medium.mybridge.co/machine-learning-open-source-for-the-past-month-v-may-2019-bf4ff9b80b1b