成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

從新冠數據集到AutoML庫集,值得學習的數據科學項目

大數據
像這樣的官方要求之下未知期限的集體休假,確實是極為罕見的。這可能是難得的時機,一個真正深入研究并從事于數據科學項目的機會。

像這樣的官方要求之下未知期限的集體休假,確實是極為罕見的。這樣的“封鎖”或許讓你崩潰,孤獨感和經濟壓力可能正在襲來。但也不完全是壞事,尤其當你計劃提高數據科學組合能力,并想要在危機后,得到一份可靠且與行業相關的簡歷的時候!

這可能是難得的時機,一個真正深入研究并從事于數據科學項目的機會。你有了大把的時間,并且社區中不乏也開源數據科技項目和想法。從計算機視覺和自然語言處理項目到python和工程數據的想法,每個人都有一個項目。

唯一的問題是——應該從哪兒開始?這個問題從來沒有像現在這么有意義,這也是本文想要回答的問題。準備好了嗎?Let’s go!

1. 冠狀病毒時間序列數據

從哪兒開始?不如就從為什么你居然在一個工作日躺在床上說起吧。

新冠病毒正主宰著世界,所有的網站標題永遠是新冠。幸虧全球有很多研究室和組織一直收集有關新冠肺炎的數據,并且對我們開放。所以為什么不使用數據科學知識來解決一些問題呢?

[[324360]]

圖源:unsplash

這個GitHub庫(https://github.com/datasets/covid-19)包含時間序列數據,該數據跟蹤了全球受新冠肺炎影響的人數,包括:

  • 新冠肺炎確診病例
  • 痊愈人數
  • 死于新冠肺炎的人數

這個項目的作者每天用 CSV格式更新數據集,你今天就可以下載下來然后開始分析。

你還可以看看另一個GitHub庫,其中包含針對美國新冠病毒病例的數據集。

(https://github.com/nytimes/covid-19-data)

2. 谷歌的多區無線電導航系統

這是谷歌研發團隊開發的另一個開源項目,谷歌研發團隊是這樣定義ELECTRA的:

“ELECTRA是一種用于自監督語言表征的學習方法。它可以用于使用較少的計算量來預訓練transformer網絡。訓練ELECTRA模型區分‘真’令牌和由另一個神經網絡系統生成的‘偽’令牌。”

ELECTRA令筆者印象深刻的是,即使在單個GPU上也可以實現精準操作。ELECTRA在大型數據集上達到了完全不同的水平,并在SQuAD 2.0基準測試中達到了最佳的性能。

你可以通過Google的研究論文進一步了解ELECTRA。谷歌團隊目前已經發布了三個預訓練模型。

(https://openreview.net/pdf?id=r1xMH1BtvB)

從新冠數據集到AutoML庫集,值得學習的數據科學項目

在開始之前,需要把以下要求的功能安裝在機器上。

  • Python 3
  • TensorFlow1.15
  • NumPy
  • scikit-learn and SciPy

3. NLP論文摘要

自然語言處理領域在過去三年里已經取得了突飛猛進般的進展。從2017年的Transformer架構開始,我們見證了許多突破和有開創性的NLP庫,包括谷歌BERT模型,OpenAI的GPT-2等等。(https://github.com/dair-ai/nlp_paper_summaries)

從新冠數據集到AutoML庫集,值得學習的數據科學項目

圖源:tencent

這個GitHub庫是為更廣大的數據科學專業人員總結的NLP 關鍵論文集,以下是這個庫中包含的一些主題列表:

  • 對話與互動系統
  • NLP模型的可解釋性和分析
  • 語言以視覺,機器人等為基礎
  • 問答
  • 資源和評估
  • 語義學
  • 文本情感分析,文本分析以及論證挖掘
  • 語言建模
  • NLP的機器學習
  • 機器翻譯
  • 多任務學習
  • NLP應用
  • 言語與多模態
  • 道德規范與自然語言處理
  • 文本生成
  • 信息提取
  • 文本摘要
  • 語句法:添加標簽、分塊、解析

不只是這些,這里只列出來一部分。選擇一篇NLP論文并開始解析,那里提供很多一站式知識服務。

4. GoogleBrain AutoML

AutoML是為了滿足自動化典型機器學習某些任務的自動化,幾年前為了節省時間而開始的一項附帶項目,如今變成了一個成熟的研究領域。

市場中有很多AutoML工具,可以使整個ML管道自動化。對于沒有專門的數據科學團隊或負擔不起從零開始的雇傭費用的團隊而言,AutoML更受歡迎。幾乎每個科技巨頭都在市場上擁有AutoML解決方案,從谷歌的云自動機器學習到百度的EZDL(人工智能模型訓練平臺)。

[[324361]]

圖源:towardsdatascience

GoogleBrain團隊開發的數據科學項目包含了和AutoML相關的模型與庫的列表。GitHub庫從作者6天前開放源碼就已經積累了1600顆星。(https://github.com/google/automl)

5. GAN壓縮

2014年,Ian Goodfellow將對抗生成網絡推向了數據科學領域。此后,這些GAN逐漸演變為有用的(通常是娛樂性的)應用程序,例如生成藝術品和制作電影。

但是訓練GAN模型的一個重要問題是所需的強大計算能力。這就是GAN壓縮的用武之地。GAN壓縮是“壓縮條件GAN的通用方法”。它減少了流行的基于GAN模型的計算,例如pix2pix,CycleGAN等。

從新冠數據集到AutoML庫集,值得學習的數據科學項目

6. StyleGAN2——最新的GAN

這是一個最新的GAN架構。StyleGAN在計算機視覺社區中非常受歡迎,StyleGAN2使問題更趨現實。

“ StyleGAN2是生成逼真的圖像的最先進架構。此外,它還經過了明確訓練,可以在隱空間中解開方向,從而可以通過改變潛在因素來進行有效的圖像處理。”

從新冠數據集到AutoML庫集,值得學習的數據科學項目

居家隔離的日子可能暫時還無法結束,但比起上街游行抗議,沉下心來將時間投資于學習和未來,或許是一個更好的選擇。

責任編輯:趙寧寧 來源: 讀芯術
相關推薦

2020-04-22 14:58:13

數據科學數據數據分析

2019-09-10 07:58:01

字符集MySQL數據庫

2020-04-09 15:32:20

數據科學AutoML代智能

2019-11-14 15:56:18

開源技術 軟件

2024-07-11 11:07:41

2023-12-01 16:23:52

大數據人工智能

2016-11-25 13:21:09

2021-12-13 09:14:06

清單管理數據集

2019-06-19 09:13:29

機器學習中數據集深度學習

2020-06-10 07:54:11

PythonSQL數據科學

2020-08-12 09:46:46

TensorFlow數據機器學習

2010-04-21 09:49:10

Oracle數據庫字符

2020-07-15 13:51:48

TensorFlow數據機器學習

2020-09-08 15:15:06

Python數據科學Python庫

2020-04-21 15:42:26

數據科學數據集數據

2010-04-13 12:23:34

Oracle數據庫

2019-03-21 16:27:21

數據開發機器學習

2023-08-28 10:42:22

數據庫Oracle

2020-06-24 07:53:03

機器學習技術人工智能

2019-10-14 15:41:37

數據科學GitHub機器學習
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: www.中文字幕 | 亚洲国产福利视频 | 国产精品1区 | 欧洲视频一区二区 | 性国产丰满麻豆videosex | 国产欧美一区二区在线观看 | 亚洲成人www | 黄色一级片视频 | 亚洲激情一区二区三区 | 亚洲精品国产电影 | 中文字幕精品一区 | 亚洲欧美成人影院 | 久久久精品视 | 亚洲高清视频一区二区 | 日韩高清不卡 | 最新中文字幕在线 | 欧美一区二区小视频 | 欧美在线亚洲 | 精品欧美一区二区精品久久 | 成人午夜免费福利视频 | 久久出精品 | 欧美一区二区三区视频在线观看 | 国产精品久久久久久久久久久久午夜片 | 国产精品视频播放 | 欧美日韩精品一区 | 欧美在线国产精品 | 国产男女视频 | 久久看精品 | 麻豆国产一区二区三区四区 | 国产成人小视频 | 成人美女免费网站视频 | 97人澡人人添人人爽欧美 | 羞羞涩涩在线观看 | 日本在线视频一区二区 | 一级二级三级在线观看 | 成人av一区二区三区 | а天堂中文最新一区二区三区 | 欧美一区二区 | 夜夜艹天天干 | 亚洲一区二区久久久 | 久久国产亚洲 |