五月GitHub最熱機器學習項目都在這里了

作者：郭一璞 2019-05-27 17:32:50

新聞機器學習

Mybridge AI博客從將近250個機器學習開源項目中找到了標星數排名最靠前的Top 10項目，涵蓋視覺問答、對象檢測、自動生成評論等多個維度。

本文經AI新媒體量子位（公眾號ID:QbitAI）授權轉載，轉載請聯系出處。

您的五月余額已不足，這個月最新最火的機器學習項目都看過了嗎？

Mybridge AI博客從將近250個機器學習開源項目中找到了標星數排名最靠前的Top 10項目，涵蓋視覺問答、對象檢測、自動生成評論等多個維度。

一起來看看吧~

第1名：Pythia

Pythia是Facebook人工智能實驗室出品的視覺和語言多模式研究的模塊化框架，2138星。

Pythia基于PyTorch，支持Model Zoo、多任務，有各種內置數據集比如VQA、VizWiz，支持基于DataParallel和DistributedDataParallel的分布式訓練，還可以實現高度自定義。

另外，拿Pythia來做TextVQA和VQA的入門代碼庫也不錯。

鏈接：

https://github.com/facebookresearch/pythia

第2名：云注釋（Cloud Annotations）

自定義對象檢測和分類訓練，2014星。

基于IBM云對象存儲，在TensorFlow上訓練，需要先在線進行圖像標注，macOS，Windows和Linux都可以用。

鏈接：

https://github.com/cloud-annotations/training

第3名：PySOT

商湯出品，可以在視頻里追蹤單個對象，實現SiamRPN和SiamMask等算法，1703星。

PySOT實現了最先進的單一對象跟蹤算法，包括SiamRPN和SiamMask等，用Python編寫，在PyTorch上運行。

鏈接：

https://github.com/STVIR/pysot

第4名：PyTorch-BigGraph

大規模圖形結構數據生成嵌入軟件，1417星，同樣也是Facebook出品，主要作者是巴黎的Luca Wehrstedt。

PyTorch-BigGraph是一個分布式系統，可以搞定多達數十億實體和數萬億邊緣的大型網絡交互圖形。

用PyTorch-BigGraph的話需要Python 3.6或更高版本，最低PyTorch 1.0，不需要投喂GPU，但是比較費CPU。

鏈接：

https://github.com/facebookresearch/PyTorch-BigGraph

第5名：InterpretML - Alpha

微軟出品，用來訓練可解釋的機器學習模型，1039星。

這里的“可解釋”指的是可以解釋模型調試中遇到的錯誤，模型有沒有搞歧視，如何讓人類理解這個模型，模型是否合法，在醫療、司法等高風險的領域靠不靠譜。

鏈接：

https://github.com/microsoft/interpret

第6名：Weights & Biases

可視化和追蹤機器學習實驗工具，1098星。

分析機器學習實驗，比TensorBoard更輕量級。每次運行時，可以保存超參數和輸出指標，訓練過程中能實現可視化模型，還能自動跟蹤代碼狀態，系統指標和配置參數。

鏈接：

https://github.com/wandb/client

第7名：MLIR

“多級中間表示”編譯器基礎結構，832星。

TensorFlow的一部分。MLIR旨在成為一種混合IR（intermediate representation），可以支持統一基礎架構中的多種不同要求，能夠表示所有TensorFlow圖，在TensorFlow圖上實現優化和轉換，用TensorFlow圖或者TF Lite完成量化和圖變換。

鏈接：

https://github.com/tensorflow/mlir

第8名：MeshCNN

PyTorch中三維網格的卷積神經網絡，367星。

這是SIGGRAPH 2019上發表的一篇論文，可以用來做3D形狀分割，作者來自以色列特拉維夫大學和亞馬遜。

類似傳統CNN，MeshCNN結合了在網格邊緣上運行的專用卷積和池化層。卷積應用于邊緣和它們的入射三角形的四個邊緣，池化層用邊緣折疊操作保留表面拓撲結構，給后面的層生成了網狀連接。

鏈接：

https://github.com/ranahanocka/MeshCNN

第9名：TensorWatch

微軟出品，用于深度學習和強化學習的調試，監控和可視化，299星。

TensorWatch是一款專為深度學習和強化學習而設計的debug和可視化工具。它充分利用Jupyter Notebook顯示實時可視化，不需要一直翻日志就能實時查詢訓練過程，還可以用來構建自己的UI和儀表板。

此外，TensorWatch利用幾個優秀的庫來可視化模型圖，審查模型統計，解釋預測等。

鏈接：

https://github.com/microsoft/tensorwatch

第10名：hncynic

一個獵奇項目，自動生成hacker news風格的評論，完全無視文章本身，看一眼標題，剩下全靠編，240星。

來源靠的是hacker news評論數據，借此訓練Transformer編碼器-解碼器模型，中途還順手用了一下維基百科的數據。

生成的評論大多腦洞清奇。

比如這個新聞標題《用TensorFlow檢測魚》，生成的評論是醬嬸的：

這篇文章太辣雞了。

1.為什么代碼看起來像一堆黑盒子標簽？我沒有看到它。

2.為什么你的模型不利用這些理論？為什么不是黑盒子分類器？

如果模型沒有取出紅盒子，它開始看到紅盒子，看起來像一個沒有明確顏色的黑盒子（看起來它知道藍色是什么）——它怎么能看到紅盒子，甚至能看出是黑盒子？

在一個不了解我們如何使用“黑匣子”和“藍盒子”來檢測真實環境中的魚類并使用黑匣子代替白紙盒的世界中，我們都知道這一點。

看起來好像很有道理的樣子，然而完全不知道在說啥，而且是滿滿的杠精畫風啊！

鏈接：

https://github.com/leod/hncynic

傳送門

原文鏈接：

https://medium.mybridge.co/machine-learning-open-source-for-the-past-month-v-may-2019-bf4ff9b80b1b

責任編輯：張燕妮來源：量子位

機器學習人工智能計算機

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看