成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

免費的數據源網站大全!再也不愁找不到數據練手

新聞 大數據
無論是做數據分析,數據挖掘還是機器學習,對于新手來說,學習再多的模型、算法理論,可能都不如一次實踐學到的多,所以我經常建議大家在學習的過程中多通過實戰項目練練手,加強對算法、模型的理解。

 [[331092]]

無論是做數據分析,數據挖掘還是機器學習,對于新手來說,學習再多的模型、算法理論,可能都不如一次實踐學到的多,所以我經常建議大家在學習的過程中多通過實戰項目練練手,加強對算法、模型的理解。

要練手上哪找數據呢?平常我做的分析實戰里都會把數據集提供給大家練習,今天我干脆為大家整理了我平常做數據分析、數據挖掘練習的時候經常用到的數據集網站,對做機器學習的朋友也很有用

簡單、公開的數據集

先分享一些科研機構、企業、政府會開放的一些數據集和一些專業的數據下載網站。這些數據集一般都比較完善、質量相對較高,拿到手數據清洗的工作比較少,適合新手做一些簡單基礎的分析

1、中國統計信息網:http://www.tjcn.org/

全國各級政府各年度的國民經濟和社會發展統計信息,部分數據免費

2、國家統計局:http://www.stats.gov.cn/

各種民生相關的統計數據,而且所有數據都是免費,而且這個網站的友情鏈接里還有很多其他地方的數據以及國外數據

免費的數據源網站大全!再也不愁找不到數據練手

3、中國產業信息網:
http://www.chyxx.com/data/

包含了各個行業相關的數據,所有的數據全部免費,做行業分析經常用到的

免費的數據源網站大全!再也不愁找不到數據練手

4、美國政府公開數據:https://www.data.gov/

美國政府公開數據的網站,包含了經濟、消費、教育、醫療、農業等多個領域的數據

5、世界銀行:
https://data.worldbank.org/

世界銀行的開放數據。平臺還提供了一些工具,比如開放數據目錄,世界發展指數,教育指數等。

6、百度數據開放平臺:
https://open.baidu.com/open/#/open

免費的數據源網站大全!再也不愁找不到數據練手

7、國云數據市場:https://link.zhihu.com/?target=
http%3A//www.moojnn.com/data-market/

主要包含:生活服務、教育、能源、建筑、交通運輸、政府、金融、農業、醫療、衛生等行業的數據,大部分免費,有些需要付費

免費的數據源網站大全!再也不愁找不到數據練手

數據可視化項目數據集

最常見的數據可視化項目就是制作某某地區人均收入區別的信息圖,找數據可視化項目相關的數據集的時候,我們希望數據集盡量“干凈”,減少數據清洗的工作,數據要足夠有趣,能夠支撐起豐富的圖表,所以這類的數據可以去上面我的說一些公開數據網站找,另外我也列一些除了政府網站之外的相關網站:

1、FiveThirtyEight:
http://fivethirtyeight.com/

這是互動式新聞與體育賽事的網站,網站中會發布許多數據相關的文章,這些文章中會把使用到的數據集發布在github上,除了獲取數據集,你還可以參考別人的項目過程

2、Socrata OpenData:
https://opendata.socrata.com/

Socrata OpenData 網站包含多個清洗后的數據集,可以直接在瀏覽器中查看,也可以下載到本地進行可視化,大部分數據來源于美國政府。

數據建模、機器學習的數據集

1、UCI:
https://archive.ics.uci.edu/ml/datasets.html

UCI是加州大學歐文分校開放的經典數據集,是機器學習領域最有名的數據存儲庫。包含各種數據集,比如經典的泰坦尼克號幸存預測到最新的數據(如空氣質量和GPS軌跡)。

2、阿里天池:
https://tianchi.aliyun.com/

作為國內互聯網龍頭阿里巴巴旗下的大數據競賽網站,提供了很多比賽數據集可以練手,說不定還能順手拿個獎,賺點獎金

免費的數據源網站大全!再也不愁找不到數據練手

3、Kaggle
https://www.kaggle.com/datasets

Kaggle 是一個舉辦了多項機器學習競賽的數據科學社區。用戶可以自己上傳數據集,也可以通過某項競賽下載數據集,里面有不少別的平臺找不到的有趣數據集。

免費的數據源網站大全!再也不愁找不到數據練手

4、科賽網:
https://www.kesci.com/home/project

這個網站提供了不少數據集可以免費下載,而且還有一些數據項目的比賽,不過整體來說項目的難度比較低,獎金也不是很多,學生參加的比較多,反正單純用來獲取數據集還是很不錯的

免費的數據源網站大全!再也不愁找不到數據練手

5、Quandl

這是一個包含經濟與金融數據的倉庫。其中的部分信息是免費的,但是大部分數據集需要購買,數據可以用來構建經濟指標預測或者股價分析模型等等。

免費的數據源網站大全!再也不愁找不到數據練手

大型數據集

有時候你可能只是想找一些大型的數據集來進行分析,分析的結果可能并不重要,重要的只是對于數據的讀取與分析過程,練習數據處理能力,這里我也列舉幾個用的比較多的網站:

1、AWS 公開數據集:
https://www.amazon.com/aws

亞馬遜在其 Amazon Web Services 中提供了一些大型數據集可以免費下載,不過你得注冊一個aws賬戶,新用戶有免費訪問的權限

免費的數據源網站大全!再也不愁找不到數據練手

2、Google 公開數據集:
https://cloud.google.com/bigquery/public-data/

Google提供了一些數據集作為其Big Query工具的一部分。包括 GitHub 公共資料庫的數據,Hacker News 的所有故事和評論。

3、Youtube標簽視頻數據集
:https://research.google.com/youtube8m/

Youtube標簽視頻數據集包括來自4800個可視化實體的800萬個YouTube視頻ID和相關標簽。它具有數十億幀的預計算的、最先進的視覺功能。

 

責任編輯:張燕妮 來源: 今日頭條
相關推薦

2020-06-29 14:33:36

技術周刊

2021-12-01 17:24:11

編程學習網站程序員

2018-05-10 08:20:23

自然語言數據集數據

2017-09-04 14:52:51

Tomcat線程數據源

2017-06-14 23:42:27

大數據數據源架構

2018-01-11 10:53:15

無服務器容器實施

2009-06-15 13:24:46

JBoss數據源

2010-12-27 09:59:11

ODBC數據源

2015-05-29 09:01:48

2021-06-08 07:48:26

數據 Python開發

2019-05-09 09:54:41

免費數據源Google Tren

2022-11-07 08:58:41

搜索數據索引

2019-05-09 09:49:19

數據源數據集數據

2023-11-27 09:16:53

Python數據源類型

2020-03-02 11:50:05

人工智能機器學習技術

2013-06-07 10:05:18

2019-04-10 08:30:53

Python機器學習工具

2023-11-27 17:11:02

數據庫oracle

2013-06-09 10:15:09

2021-10-18 06:54:47

數據源數據預處理
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 男人天堂99| 国产精品一区二区三区免费观看 | 亚洲一区在线观看视频 | 91精品国产91久久久久久不卞 | 亚洲欧美日韩精品久久亚洲区 | 欧美日韩1区2区3区 欧美久久一区 | 一区二区三区欧美在线观看 | 亚洲导航深夜福利涩涩屋 | 亚洲免费三级 | 欧美午夜精品理论片a级按摩 | 亚洲vs天堂 | 亚洲精品视频一区 | 亚洲成人精品一区二区 | www免费视频 | 久久国色 | 超黄毛片 | 精品福利在线 | 久久精品99久久 | 亚洲精久久 | 久久久久国产一区二区三区 | 国产精品久久久久久妇女 | 久久黄色网| 天天久久 | 欧美成人aaa级毛片在线视频 | 91在线电影 | 欧美日韩视频在线播放 | 国产精品一区二区久久 | 亚洲一区二区视频在线观看 | 日韩有码一区 | 国产免费人成xvideos视频 | 亚洲一区二区成人 | 精产国产伦理一二三区 | 国产精品福利在线 | 精品国产成人 | 久久日韩精品一区二区三区 | 一本大道久久a久久精二百 欧洲一区二区三区 | 免费的一级视频 | 亚洲精品v日韩精品 | 精品粉嫩aⅴ一区二区三区四区 | a久久 | 中文字幕四虎 |