成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

非常實用的Python庫

開發(fā) 后端
在本文中,我們會研究一些用于數(shù)據(jù)科學(xué)任務(wù)的 Python 庫,而不是常見的比如 panda、scikit-learn 和 matplotlib 等的庫

 Python 是一個很棒的語言。它是世界上發(fā)展最快的編程語言之一。它一次又一次地證明了在開發(fā)人員職位中和跨行業(yè)的數(shù)據(jù)科學(xué)職位中的實用性。整個 Python 及其庫的生態(tài)系統(tǒng)使它成為全世界用戶(初學(xué)者和高級用戶)的合適選擇。它的成功和流行的原因之一是它強(qiáng)大的第三方庫的集合,這些庫使它可以保持活力和高效。

在本文中,我們會研究一些用于數(shù)據(jù)科學(xué)任務(wù)的 Python 庫,而不是常見的比如 panda、scikit-learn 和 matplotlib 等的庫。盡管像 panda 和 scikit-learn 這樣的庫,是在機(jī)器學(xué)習(xí)任務(wù)中經(jīng)常出現(xiàn)的,但是了解這個領(lǐng)域中的其它 Python 產(chǎn)品總是很有好處的。

Wget

從網(wǎng)絡(luò)上提取數(shù)據(jù)是數(shù)據(jù)科學(xué)家的重要任務(wù)之一。Wget 是一個免費(fèi)的實用程序,可以用于從網(wǎng)絡(luò)上下載非交互式的文件。它支持 HTTP、HTTPS 和 FTP 協(xié)議,以及通過 HTTP 的代理進(jìn)行文件檢索。由于它是非交互式的,即使用戶沒有登錄,它也可以在后臺工作。所以下次當(dāng)你想要下載一個網(wǎng)站或者一個頁面上的所有圖片時,wget 可以幫助你。安裝: 

  1. $ pip install wget 

例子: 

  1. import wget  
  2. url = 'http://www.futurecrew.com/skaven/song_files/mp3/razorback.mp3'  
  3. filename = wget.download(url)  
  4. 100% [................................................] 3841532 / 3841532  
  5. filename  
  6. 'razorback.mp3'  
  7. ### Pendulum 

對于那些在 python 中處理日期時間時會感到沮喪的人來說,Pendulum 很適合你。它是一個簡化日期時間操作的 Python 包。它是 Python 原生類的簡易替代。請參閱文檔深入學(xué)習(xí)。

安裝: 

  1. $ pip install pendulum 

例子: 

  1. import pendulum  
  2. dt_toronto = pendulum.datetime(2012, 1, 1, tz='America/Toronto' 
  3. dt_vancouver = pendulum.datetime(2012, 1, 1, tz='America/Vancouver' 
  4. print(dt_vancouver.diff(dt_toronto).in_hours())  
  5. 3  

imbalanced-learn

可以看出,當(dāng)每個類的樣本數(shù)量基本相同時,大多數(shù)分類算法的效果是最好的,即需要保持?jǐn)?shù)據(jù)平衡。但現(xiàn)實案例中大多是不平衡的數(shù)據(jù)集,這些數(shù)據(jù)集對機(jī)器學(xué)習(xí)算法的學(xué)習(xí)階段和后續(xù)預(yù)測都有很大影響。幸運(yùn)的是,這個庫就是用來解決此問題的。它與 scikit-learn 兼容,是 scikit-lear-contrib 項目的一部分。下次當(dāng)你遇到不平衡的數(shù)據(jù)集時,請嘗試使用它。

安裝: 

  1. pip install -U imbalanced-learn  
  2. # 或者  
  3. conda install -c conda-forge imbalanced-learn 

例子:

使用方法和例子請參考文檔。

FlashText

在 NLP 任務(wù)中,清理文本數(shù)據(jù)往往需要替換句子中的關(guān)鍵字或從句子中提取關(guān)鍵字。通常,這種操作可以使用正則表達(dá)式來完成,但是如果要搜索的術(shù)語數(shù)量達(dá)到數(shù)千個,這就會變得很麻煩。Python 的 FlashText 模塊是基于 FlashText 算法為這種情況提供了一個合適的替代方案。FlashText 最棒的一點是,不管搜索詞的數(shù)量如何,運(yùn)行時間都是相同的。你可以在這里了解更多內(nèi)容。

安裝: 

  1. $ pip install flashtext 

例子:

提取關(guān)鍵字 

  1. from flashtext import KeywordProcessor  
  2. keyword_processor = KeywordProcessor()  
  3. # keyword_processor.add_keyword(<unclean name><standardised name> 
  4. keyword_processor.add_keyword('Big Apple', 'New York')  
  5. keyword_processor.add_keyword('Bay Area')  
  6. keywords_found = keyword_processor.extract_keywords('I love Big Apple and Bay Area.')  
  7. keywords_found  
  8. ['New York', 'Bay Area'] 

替換關(guān)鍵字 

  1. keyword_processor.add_keyword('New Delhi', 'NCR region')  
  2. new_sentence = keyword_processor.replace_keywords('I love Big Apple and new delhi.')  
  3. new_sentence  
  4. 'I love New York and NCR region.'  
  5. Fuzzywuzzy 

這個庫的名字聽起來很奇怪,但是在字符串匹配方面,fuzzywuzzy 是一個非常有用的庫。可以很方便地實現(xiàn)計算字符串匹配度、令牌匹配度等操作,也可以很方便地匹配保存在不同數(shù)據(jù)庫中的記錄。

安裝: 

  1. $ pip install fuzzywuzzy 

例子: 

  1. from fuzzywuzzy import fuzz  
  2. from fuzzywuzzy import process  
  3. # 簡單匹配度  
  4. fuzz.ratio("this is a test", "this is a test!")  
  5. 97  
  6. # 模糊匹配度  
  7. fuzz.partial_ratio("this is a test", "this is a test!")  
  8.  100 

更多有趣例子可以在 GitHub 倉庫找到。

PyFlux

時間序列分析是機(jī)器學(xué)習(xí)領(lǐng)域中最常見的問題之一。PyFlux 是 Python 中的一個開源庫,它是為處理時間序列問題而構(gòu)建的。該庫擁有一系列優(yōu)秀的現(xiàn)代時間序列模型,包括但不限于 ARIMA、GARCH 和 VAR 模型。簡而言之,PyFlux 為時間序列建模提供了一種概率方法。值得嘗試一下。

安裝 

  1. pip install pyflux 

例子

詳細(xì)用法和例子請參考官方文檔。

Ipyvolume

結(jié)果展示也是數(shù)據(jù)科學(xué)中的一個重要方面。能夠?qū)⒔Y(jié)果進(jìn)行可視化將具有很大優(yōu)勢。IPyvolume 是一個可以在 Jupyter notebook 中可視化三維體和圖形(例如三維散點圖等)的 Python 庫,并且只需要少量配置。但它目前還是 1.0 之前的版本階段。用一個比較恰當(dāng)?shù)谋扔鱽斫忉尵褪牵篒Pyvolume 的 volshow 對于三維數(shù)組就像 matplotlib 的 imshow 對于二維數(shù)組一樣好用。可以在這里獲取更多。

使用 pip

  1. $ pip install ipyvolume 

使用 Conda/Anaconda 

  1. $ conda install -c conda-forge ipyvolume 

例子

  •  動畫

  •  體繪制

Dash

Dash 是一個高效的用于構(gòu)建 web 應(yīng)用程序的 Python 框架。它是在 Flask、Plotly.js 和 React.js 基礎(chǔ)上設(shè)計而成的,綁定了很多比如下拉框、滑動條和圖表的現(xiàn)代 UI 元素,你可以直接使用 Python 代碼來寫相關(guān)分析,而無需再使用 javascript。Dash 非常適合構(gòu)建數(shù)據(jù)可視化應(yīng)用程序。然后,這些應(yīng)用程序可以在 web 瀏覽器中呈現(xiàn)。用戶指南可以在這里獲取。

安裝 

  1. pip install dash==0.29.0  # 核心 dash 后端  
  2. pip install dash-html-components==0.13.2  # HTML 組件  
  3. pip install dash-core-components==0.36.0  # 增強(qiáng)組件  
  4. pip install dash-table==3.1.3  # 交互式 DataTable 組件(最新!) 

例子下面的例子展示了一個具有下拉功能的高度交互式圖表。當(dāng)用戶在下拉菜單中選擇一個值時,應(yīng)用程序代碼將動態(tài)地將數(shù)據(jù)從 Google Finance 導(dǎo)出到 panda DataFrame。

Gym

OpenAI 的 Gym 是一款用于增強(qiáng)學(xué)習(xí)算法的開發(fā)和比較工具包。它兼容任何數(shù)值計算庫,如 TensorFlow 或 Theano。Gym 庫是測試問題集合的必備工具,這個集合也稱為環(huán)境 —— 你可以用它來開發(fā)你的強(qiáng)化學(xué)習(xí)算法。這些環(huán)境有一個共享接口,允許你進(jìn)行通用算法的編寫。

安裝 

  1. pip install gym 

例子這個例子會運(yùn)行CartPole-v0環(huán)境中的一個實例,它的時間步數(shù)為 1000,每一步都會渲染整個場景。

總結(jié)

以上這些有用的數(shù)據(jù)科學(xué) Python 庫都是我精心挑選出來的,不是常見的如 numpy 和 pandas 等庫。如果你知道其它庫,可以添加到列表中來,請在下面的評論中提一下。另外別忘了先嘗試運(yùn)行一下它們。 

 

責(zé)任編輯:龐桂玉 來源: 馬哥Linux運(yùn)維
相關(guān)推薦

2020-09-14 11:10:43

Python代碼

2024-07-02 11:29:28

Typer庫Python命令

2023-06-04 17:13:26

.NET開發(fā)應(yīng)用程序

2019-09-26 14:56:18

GitHub 技術(shù)開源

2021-05-23 16:23:22

Python 開發(fā)編程語言

2023-03-07 16:09:08

2021-12-27 10:08:16

Python編程語言

2020-10-24 13:50:59

Python編程語言

2021-07-25 22:43:39

Python代碼開發(fā)

2020-05-28 08:59:40

Python機(jī)器學(xué)習(xí)開發(fā)

2020-12-18 09:10:36

數(shù)據(jù)庫SQL Server存儲空間

2021-01-26 12:16:00

Python開發(fā)工具

2024-11-13 13:14:38

2020-11-11 11:05:41

Linux工具命令

2022-02-22 13:14:30

Vue自定義指令注冊

2022-12-06 17:18:42

2023-12-27 14:04:00

Spring框架參數(shù)

2016-05-10 10:16:13

JavaScript技巧

2017-12-12 14:50:33

數(shù)據(jù)庫MySQL命令

2017-09-05 08:57:02

Linux命令行技巧
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产日韩欧美一区 | 欧美无乱码久久久免费午夜一区 | 免费成人av网站 | av在线电影网 | 成人三级视频在线观看 | av喷水| 亚州无限乱码 | 日本不卡一区二区三区在线观看 | 福利视频大全 | 日韩欧美一区二区三区 | 亚洲一二三视频 | 久久久久久久一区二区三区 | 亚洲一区二区精品视频 | 在线91| 全免费a级毛片免费看视频免费下 | 日本aⅴ中文字幕 | 亚洲精品久久久久久久久久久久久 | 久久精品亚洲国产奇米99 | 中午字幕在线观看 | 日韩在线免费 | 精品无码久久久久久国产 | 日韩亚洲一区二区 | 中文字幕视频在线看5 | 精品国产乱码久久久久久a丨 | 天天操网| 午夜影院视频 | 国产精品九九九 | m豆传媒在线链接观看 | 亚洲视频一| 亚洲欧美自拍偷拍视频 | 亚洲精品中文字幕在线观看 | 少妇精品久久久久久久久久 | 日韩国产精品一区二区三区 | 91亚洲精品在线观看 | 亚洲精品国产成人 | 日本中文字幕在线观看 | 999国产精品视频免费 | 国产h在线 | 青春草在线 | 精品久久久久久久人人人人传媒 | 国产乱码精品一区二区三区五月婷 |