Github八月深度學習項目熱搜Top 10,你Pick哪一個!
大數據文摘出品
編譯:CoolBoy
大家好!文摘菌發現了一份過去的一個月機器學習項目的Top 10,特地為大家搬運過來,看看你pick哪一個呢?
這個榜單是從過去一個月的250項開源機器學習項目中挑選出來的。作者比較了這段時間內的新的,重大的成果,并根據一系列的因子來衡量它的專業水準。
開源項目對程序員非常有用,希望你也可以從中找出啟發你的那一個!
第十名
GANimation:基于單圖的結構性臉部動畫(Albert Pumarola等人)[Github中獲得344星]
https://github.com/albertpumarola/GANimation?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
這是一個基于動作單元(AU)的新型GAN體系,它展示了一個連續多樣的結構性臉部變化,從而定義面部表情。此方法允許調整每個動作單元的度量,并且可以結合其中的幾個單元。
第九名
Sg2im:基于場景圖的圖像生成(谷歌開源) [Github中獲得670星]
https://github.com/google/sg2im?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
場景圖是一個視覺場景的結構表示圖,其中節點表示物體,連線表示物體間的關系。此研究介紹了一個輸入場景圖,輸出圖像的端到端神經網絡模型。
第八名
Stt-benchmark:語音到文字的基準衡量(Picovoice) [Github中獲得294星]
https://github.com/Picovoice/stt-benchmark?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
Cheetah是Picovoice為物聯網應用設計的語音識別引擎。與其他模型相比,Cheetah的表現幾乎接近于***的DeepSpeech(0.3 vs 0.32 WER)。但是,它有著快100倍的速度和少398倍的內存。這讓Cheetah可以在嵌入小型貨品的平臺(例如Raspberry Pi)運行,并且便利于大型的,需要更多計算與存儲資源的模型。
第七名
Artificial-adversary:生成對抗文本的工具,測試機器學習模型 (Airbnb Engineering)[Github中獲得155星]
https://github.com/airbnb/artificial-adversary?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
在區分用戶生成的文本時,用戶可以有很多方式修改內容,以免被監測。這包括將字符換為類似的長相的字符。例如please wire me 10,000 US DOLLARS to bank of scamland (請給我轉10,000美元)可能是一條詐騙信息,但是如果寫成pl3@se.wire me 10000 US DoLars to,BANK of ScamIand,很多鑒別器將失靈。
使用這個擴展庫,你就可以利用這些方法生成文本,并在你自己的機器學習算法上測試。
第六名
Soccerontable: 在你的桌面上觀看足球比賽(Konstantinos Rematas)[Github中獲得247星]
https://github.com/krematas/soccerontable?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
第五名
DanceNet:使用Autoencoder,LSTM和混合密度網絡的舞蹈生成器 (Keras)[Github中獲得282星]
https://github.com/jsn5/dancenet?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
第四名
UnsupervisedMT:基于短語與神經非監督機器翻譯(Facebook Research)[Github中獲得490星]
https://github.com/facebookresearch/UnsupervisedMT?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
如今的機器翻譯系統雖然接近人類的效率,但這和大量的平行語句有關。這篇文章研究了如何在單一語料庫的情形下學習翻譯。作者們提出了一種神經模型和一種基于短語的模型。兩種模型都在初始化參數、模型降噪、平行數據的迭代生成上斟酌。它們的表現大幅超越之前的模型,并且有著更簡單的結構和更少的超參數。
第三名
Vid2vid:視頻到視頻的合成(NVIDIA AI)[Github中獲得1797星]
https://github.com/NVIDIA/vid2vid?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
這篇文章提出一個新型的,利用對抗生成結構的視頻到視頻合成方法。Github包含了Pytorch的高分辨率實現。這個模型可以將語義標記圖轉為實際視頻,從描邊圖生成真人講話動作,或者是由姿勢生成人類動作。
第二名
Glow:可逆的1x1卷積生成流(OpenAI)[Github中獲得1664星]
https://github.com/openai/glow?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
Glow是一個可逆的生成模型,它被用來做1x1的可逆卷積。它延續了之前的研究(https://arxiv.org/abs/1605.08803),并簡化了其結構。此模型可以生成高分辨率的圖像,發現可操縱數據的特征。
***名
Autokeras:自動化機器學習(AutoML)的開源軟件庫(Haifeng Jin)[Github中獲得2637星]
https://github.com/jhfjhfj1/autokeras?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
Auto-Keras是一個AutoML的開源軟件庫。它由德州農機大學的DATA Lab開發。AutoML的最終目的是將簡易的深度學習工具提供給各個領域中不具有數據科學背景的專家。Auto-Keras提供了一些函數,以建立可自動尋找結構和超參數的深度學習模型。
相關報道:
https://medium.mybridge.co/machine-learning-open-source-of-the-month-v-aug-2018-ae85e7302ea5
【本文是51CTO專欄機構大數據文摘的原創譯文,微信公眾號“大數據文摘( id: BigDataDigest)”】