成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大盤點:8月Github上7個值得關注的數據科學項目

大數據 機器學習
本文帶你來看看GitHub上創建于2019年8月的7個數據科學項目。筆者所選項目的范圍十分廣泛,涉及從機器學習到強化學習的諸多領域。

[[279134]]

準備好在機器學習之路上再邁出一大步了嗎?使用試驗性數據集、流行的數據科學庫和框架是個好的開始,但如果想在競爭中脫穎而出,必須有所突破,使自己與眾不同。

最佳途徑就是運用數據科學領域最新技術完成項目。想成為計算機視覺領域的專家嗎?那就去學習最先進的目標檢測算法。如果希望在自然語言處理(NLP)方面有所建樹,那就學習Transformer模型的各種特性和分支。

重點是,要一直有所準備并樂于鉆研最新的數據科學技術。數據科學是發展最快的領域之一,作為數據科學家的我們也需要不斷學習成長。

本文帶你來看看GitHub上創建于2019年8月的7個數據科學項目。筆者所選項目的范圍十分廣泛,涉及從機器學習到強化學習的諸多領域。

本文將這些數據科學項目分為三大類:

  • 機器學習項目
  • 深度學習項目
  • 編程項目大盤點:8月Github上7個<span><span><span><i style=最好的數據科學項目" src="http://p9.pstatp.com/large/pgc-image/bdc119a2c04647449f7e723dafb1d748" _fcksavedurl="http://p9.pstatp.com/large/pgc-image/bdc119a2c04647449f7e723dafb1d748" width="1" height="1">

機器學習項目

pyforest——用一行代碼導入所有Python數據科學庫

筆者非常喜歡這個Python庫。正如標題所述,所有常用的數據科學庫都可以通過一個pyforest庫導入。看看筆者從該庫的Github倉庫中摘錄的示例:

大盤點:8月Github上7個值得關注的數據科學項目

激動了嗎?Pyforest目前包括pandas、NumPy、matplotlib等數據科學庫。

只需調用pip install pyforest這一指令在機器上安裝該庫,就能用一行代碼導入所有流行的Python數據科學庫。

  1. from pyforest import * 

太神奇了!你一定也會像筆者這樣享受使用它的過程。

HungaBunga – 另一種使用sklearn庫搭建機器學習模型的方式

如何從搭建好的機器學習模型中選出最合適的那一個?如何確保發揮作用的是正確的超參數?這些都是數據科學家需要解答的關鍵問題。

相較于其他大多數數據庫,HungaBunga項目能讓用戶更快地找到答案。它會利用所有可能的超參數來運行sklearn庫中的所有模型(是的,所有!),隨后通過交叉驗證對模型進行排序。

大盤點:8月Github上7個值得關注的數據科學項目

下面是導入所有模型(包括分類模型和回歸模型)的方式:

  • from hunga_bunga import HungaBungaClassifier, HungaBungaRegressor

看看下面這篇全面討論了監督機器學習算法的文章:

  • 常用的機器學習算法(使用Python和R語言)

深度學習項目

DeepMind發布的用于強化學習的Behavior Suite(bsuite)

大盤點:8月Github上7個值得關注的數據科學項目

最近Deepmind連年增長的巨額虧損成了新聞。但是必須承認,這家公司在強化學習研究方面仍遙遙領先。他們在這一領域投入大量人力物力,認為強化學習是人工智能的未來。

下面介紹他們最新的開源產品——bsuite。這一項目集合了許多實驗的成果,這些實驗旨在理解強化學習對象的核心性能。

筆者喜歡這一研究領域,因為它必然會努力達成兩個目的(每個Github倉庫達成一個):

  • 收集有價值且可推廣運用的項目,這些項目會捕捉到在設計高效通用的機器學習算法時遇到的關鍵問題。
  • 以通用尺度為標準,通過對象的表現研究其行為。

這個Github倉庫詳細解釋bsuite的使用方式。

讀者肯定聽說過BERT。它基于Transformer架構,是自然語言處理(NLP)領域最流行的框架,并且正被越來越廣泛地應用。

但是注意:運行它可能需要大量的資源。那么數據科學家該如何在自己的機器上運行BERT呢?更進一步,使用DistilBERT!

大盤點:8月Github上7個值得關注的數據科學項目

DistilBERT是Distillated-BERT的略稱,由PyTorch轉換框架團隊開發。它是在BERT架構基礎上搭建的一個小型且便宜的Transformer模型。開發團隊稱DistilBERT比BERT運行速度快60%,而性能與BERT相差不到5%。

這一Github倉庫講述了DistilBERT和Python代碼協同工作的方式。可以點擊下方鏈接了解更多有關PyTorch-Transformers框架及其在python中的使用方法。

ShuffleNet Series ——一個極其高效、用于移動設備的卷積神經網絡

接下來介紹的是計算機視覺項目!ShuffleNet是一個計算效率極高的卷積神經網絡架構,適用于計算力有限的移動設備。

大盤點:8月Github上7個值得關注的數據科學項目

這個Github倉庫包含了以下ShuffleNet模型(對,不止一個):

  • ShuffleNet: 一個極其高效、用于移動設備的卷積神經網絡
  • ShuffleNetV2: 高效CNN架構設計的實用建議
  • ShuffleNetV2+: ShuffleNetV2的強化版本
  • ShuffleNetV2.Large: ShuffleNetV2的深化版本
  • OneShot: 通過均勻抽樣進行單通路單樣本神經架構的研究
  • DetNAS: 目標檢測技術的支撐性研究

RAdam –提高學習率方差

目前,發布時間不到兩周的RAdam項目已經得到了1200多顆星星的評價。足以證明這個倉庫非常給力!

RAdam的開發者在其論文中(https://arxiv.org/pdf/1908.03265.pdf)表明,深度學習技術的收斂問題是由于在模型訓練的早期階段,自適應學習率的方差過大。

RAdam是Adam的一個新版本,可以修正自適應學習率的變化。這個版本在普通的Adam優化器基礎上做出了切實改進,改善了方差問題。

處理不同學習率時RAdam的表現與Adam和SGD的對比如下(X軸代表訓練輪數):

大盤點:8月Github上7個值得關注的數據科學項目

一定要查閱下面關于機器學習優化的指南(其中包含Adam的相關內容):

編程項目

ggtext –用于ggplot2的升級版文本渲染

對于社區中的所有R語言用戶,尤其對于那些經常使用ggplot2包的用戶(幾乎每個人),這個項目會非常實用。

大盤點:8月Github上7個值得關注的數據科學項目

Ggtext包讓用戶能夠對生成的圖像進行富文本渲染。下面是一些可以通過ggtext完成的操作:

  • 產生一個新的名為element_markdown()的主題元素,它能將文本渲染為markdown語言或者HTML
  • 在坐標軸中插入圖像(如下圖所示)
  • 使用geom_richtext()函數創建markdown/HTML標簽(如下圖所示)

大盤點:8月Github上7個值得關注的數據科學項目

這個GitHub倉庫包含了一些直觀的例子,讀者可以在自己的機器上重復這些示例。

Ggtext目前還不能通過CRAN調用,用戶需要下載并通過下面的指令從GitHub安裝它:

 

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2023-06-12 11:51:20

2013-04-11 10:00:44

云計算項目開源Puppet

2019-11-14 15:56:18

開源技術 軟件

2020-06-28 10:40:45

Github人工智能技術

2019-12-02 21:44:34

數據科學市場營銷顧客

2018-11-16 12:12:11

網絡認證網絡管理員數據中心

2019-09-25 10:08:16

GitHub 技術開源

2020-01-09 10:01:55

電腦搜索引擎工具

2014-08-08 15:55:11

Github項目匯總

2020-08-01 15:54:07

Github開源項目

2019-08-07 15:39:35

GitHub代碼開發者

2024-03-07 12:01:32

前端開源開發

2022-07-18 09:26:52

數據存儲

2021-09-02 10:38:24

開源項目Github

2019-12-19 15:07:24

軟件數據庫Linux

2020-09-08 15:15:06

Python數據科學Python庫

2019-09-04 11:22:53

開源GitHub開源項目

2018-04-23 14:01:04

數據科學機器學習開發

2021-01-06 16:30:55

SQL數據庫安全

2019-08-12 08:11:23

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人在线免费网站 | 欧美日韩精品久久久免费观看 | 欧美一区二区三区免费电影 | 91精品一区二区三区久久久久 | 国产人成在线观看 | 国产在线视频一区二区 | 中文字幕不卡一区 | 91精品国产一二三 | 日本色高清| 国产高清在线视频 | 国产亚洲精品久久19p | 黄色日批视频 | 一级一级一级毛片 | 中文二区 | 欧美日韩精品 | 国产精品福利在线 | 久久国产区| 久久成人免费 | 国产第二页 | 色999视频 | 久久久久久国产 | 日韩精品在线网站 | 久久中文字幕电影 | 日韩在线欧美 | 91porn成人精品| 国产乱性 | 久久不卡 | 国产一区精品在线 | 欧美国产视频 | 亚洲成人中文字幕 | 国产高清视频在线观看播放 | 国产一区 | 亚洲一级av毛片 | 亚洲精品久久 | 久久久精品网站 | 欧美色人 | 精品综合视频 | 国产不卡在线观看 | 国产一区二区欧美 | 国产精品久久9 | 欧美第一页 |