成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

這款NLP神器火了!關鍵詞提取、結果可視化,從小白進階大神

新聞 開發工具
如何快速優雅地處理你的NLP數據集?試試這款號稱「從小白到大神」的Texthero的工具包。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

如何快速優雅地處理你的NLP數據集?

試試這款號稱「從小白到大神」的Texthero的工具包。

不僅編寫界面友好美觀,而且功能全面,預處理、表征、可視化樣樣精通,在Reddit上17個小時內就獲得了近1.1k的熱度。

這款NLP神器火了!關鍵詞提取、結果可視化,從小白進階大神

連剛脫機的NLP程序猿看了都想與數據集再戰幾回:

這款NLP神器火了!關鍵詞提取、結果可視化,從小白進階大神

下面是Texthero的使用界面。

這款NLP神器火了!關鍵詞提取、結果可視化,從小白進階大神
 優雅美觀的NLP數據處理界面

事實上,Texthero的優雅絕不僅僅在于界面的友好,最關鍵的是,它省略了大量重復性代碼編寫工作。

只需要幾行代碼,Texthero就能幫你完成想要的數據預處理、表征、可視化等操作,極大程度上解放了你的雙手。

來看看Texthero進行數據預處理、各種算法后的可視化效果。

效果展示

首先,進行文本清理,然后采用TF-IDF算法進行特征表示,并對此可視化:

這款NLP神器火了!關鍵詞提取、結果可視化,從小白進階大神

PCA降維后的效果duangduang的:

這款NLP神器火了!關鍵詞提取、結果可視化,從小白進階大神
 進行文本清理和TF-IDF表征后的可視化效果

這不是你想要的?

那么,除了預處理和表征外,試試加上K均值聚類算法,并進行可視化:

這款NLP神器火了!關鍵詞提取、結果可視化,從小白進階大神

效果如下:

這款NLP神器火了!關鍵詞提取、結果可視化,從小白進階大神
 進行預處理、表征和K均值聚類算法后的數據效果

經過K均值聚類算法處理后的結果一目了然。

不僅設計友好,加載代碼后,結果會生成在在同一個界面上,整體邏輯流程顯得非常明了。

 使用效果

從展示界面來看,Texthero只需要編寫少量代碼,就能得到你想要的結果,為數據處理省去了不少時間。

事實上,只要掌握基本使用邏輯,萌新也能快速上手這款NLP數據處理神器。

使用指南

pip一下texthero后(或從GitHub上直接下載工具包,文末附代碼鏈接),采用import導入它和pandas:

之后,加載你需要處理的文本信息數據集(這里采用了BBC sport數據庫舉例):

然后就可以開始使用了:

預處理

如果需要進行快速的數據預處理操作,直接使用「文本清理」就行:

當然,如果你需要對文本信息進行更細節的處理操作,例如將所有標點符號替換成空格、或者刪除<>中的所有內容,Texthero也提供了非常完備的工具包,以供使用。

 光是預處理欄目就有這么多工具

再也不用編寫一大堆代碼,專門清理文本中的冗余數據了。

表征

同樣,如果需要進行TF-IDF算法特征表示的話,同樣只需要幾行代碼就能實現:

一鍵出結果:

如果需要更多的算法,這里也有meanshift、NMF等算法可以選用,每種算法基本都集成在一行代碼中,你想要的這里都有。

可視化

而在可視化方向上,Texthero同樣展現出了強大的能力,這里以PCA降維后的結果進行展示:

可視化界面非常清晰:

同樣,可視化也可以自定義顏色、界面展示效果等,只需要一點Python的知識就能快速使用。

這么方便的NLP數據處理工具包,趕緊用起來~

傳送門

代碼鏈接:

https://github.com/jbesomi/texthero

項目鏈接:

https://texthero.org/

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2011-06-14 19:11:38

關鍵詞

2011-06-20 14:32:59

關鍵詞

2022-08-26 09:15:58

Python可視化plotly

2011-06-07 18:45:41

關鍵詞

2017-04-28 16:16:46

2022-02-23 09:50:52

PythonEchartspyecharts

2023-06-09 00:09:46

MySQL分庫分表

2021-07-02 14:07:00

可視化Plotly漏斗圖

2019-12-22 13:48:26

退休科技行業大佬

2011-05-25 17:38:56

關鍵詞

2011-05-25 17:58:00

2013-08-26 15:43:40

AppStore關鍵詞開發者應用選取關鍵詞

2022-06-28 09:34:24

可視化Python代碼

2009-11-03 09:02:59

Windows 7蘋果競爭

2011-07-22 15:48:46

SEO

2014-09-12 14:03:45

操作系統

2021-10-08 09:27:11

Python圖形化工具

2017-12-22 23:44:50

2011-06-19 12:20:47

長尾關鍵詞

2012-03-20 22:19:16

Linux
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美精品在线视频 | 久久综合久久久 | 中国xxxx性xxxx产国 | 91亚洲国产亚洲国产 | 欧洲免费毛片 | 欧美一级免费看 | 国产网站在线免费观看 | 成人三级电影 | 一区二区三区电影网 | 欧美一区二区三区在线观看视频 | 日本在线播放一区二区 | www.天天操.com | 日韩福利| 欧美激情一区二区三级高清视频 | 亚洲欧美久久 | 欧美日韩a | 久久精品视频播放 | 精品日韩| 九九九国产| 欧美不卡网站 | 欧美日韩精品国产 | 欧美日韩一区二区视频在线观看 | caoporn国产| 欧美二三区 | 韩日一区二区 | 手机av在线 | 国产成人精品免高潮在线观看 | 欧美在线 | 日韩一区二区三区视频 | 天堂av资源 | 欧美成人精品一区二区男人看 | 韩国av一区二区 | 国产精品成人一区二区三区夜夜夜 | 日韩成人在线观看 | 亚洲欧美第一视频 | 亚洲午夜在线 | 99一区二区| 成人精品一区二区三区中文字幕 | 成人三级在线播放 | 久久精品网 | 亚洲视频三区 |