成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

dataWrangler簡介及使用方法

大數據
dataWrangler是一款由斯坦福大學開發的在線數據清洗、數據重組軟件。主要用于去除無效數據,將數據整理成用戶需要格式等。通過使用dataWrangler能節約用戶花在數據整理上的時間,從而使其有更多的精力用于數據分析。

[[200500]]

1. 工具簡介

dataWrangler是一款由斯坦福大學開發的在線數據清洗、數據重組軟件。主要用于去除無效數據,將數據整理成用戶需要格式等。通過使用dataWrangler能節約用戶花在數據整理上的時間,從而使其有更多的精力用于數據分析。

2. 主要特點

dataWrangler的操作極為簡便,通過簡單點擊就能完成一系列的數據整理。與傳統的數據處理軟件相比,其獨特的智能分析和建議功能,極大方便了用戶的數據處理操作。dataWrangler還會列出數據修改的歷史記錄,用戶可以極為方便地查看過去的修改,并可以撤銷某一條修改操作。

同時,dataWrangler是一款在線工具,這為用戶省去了安裝軟件的繁瑣過程,也使用戶擺脫了操作系統對軟件使用的限制。

3. 工具界面(工作區、菜單、術語等)

在瀏覽器的地址欄中輸入dataWrangler的地址并進入后,會進入dataWrangler獲取輸入數據的界面,如下圖所示。

 

進入dataWrangler后的數據輸入界面。 

將CSV格式的數據拷貝并粘貼到數據輸入區域后點擊dataWrangle按鈕,進入數據處理界面,開始數據的整理和修復。數據處理界面如下圖所示。 

 

數據處理主界面。

數據處理界面左側的面板包括一個根據當前選中數據給出的數據修改建議列表和一個數據操作歷史記錄列表。點擊修改建議列表中的粗體部分,就可以執行該條修改建議。界面的右側是包含具體數據的數據表。

4. 操作流程(核心功能呈現)

下面介紹dataWrangler的主要功能。

->去除無效數據

點擊無效數據的行號,這一行就會變成紅色高亮狀態,同時左側的建議欄會給出一系列的修改建議。點擊合適的修改建議后, 該修改操作將被執行。 

 

刪除空行操作。 

如圖所示,點擊”Delete empty rows”的修改建議后,所有空白行將被刪除。

->提取部分數據

在需要提取部分數據作為單獨一列時,首先選中欲提取的數據,此時dataWrangler會自動分析用戶的意圖,并提取出相應數據。如果用戶進行二次選取,則會對選取意圖進行修正,以提取用戶真正需要的數據。

下圖是用戶欲提取州名時,首先選取了”Alabama”,但此時dataWrangler認為用戶想要提取相應長度的字符, 所以沒有達到要求的”Alaska”并未被選取, 同時”California”等較長的字符也只被截取了一部分。 

 

選擇欲提取的數據。 

此時,繼續選取”Alaska”,dataWrangler通過二次選取獲知用戶想要提取的是這一位置的整個單詞,進而成功提取出了州名。如下圖所示。 

 

通過二次選取修正提取結果。 

->自動填充數據

提取出州名后,需要將其填充到每一行數據中。此時,只需點擊一下州名數據列最上方的標題,左側的智能建議欄中就會出現自動填充數據的建議。點擊該建議,即可完成自動填充數據,如下圖所示。

 

自動填充數據。

->刪除無用數據

進行數據自動填充后,遺留下來的一些數據欄已經沒有任何意義,需將其刪除。點擊欲刪除數據中國的某一行,dataWrangler會自動給出刪除建議。同時,將被刪除的行將會高亮表示,如下圖所示。 

 

刪除無用行。

點擊左側刪除建議執行刪除操作,結果如下圖所示。

 

刪除無用行后的結果。

->數據重構

在某些情況下,可能需要將數據重新組合成需要的格式。點擊表格上方的綠色方塊后,dataWrangler會給出多種數據重構建議。如下圖所示。 

 

對數據進行重構。

雙擊列名,可以對列名進行編輯, 圖中的列名已經修改為”year”,”state”等有意義的文字。

點擊左側重構建議后,得到的數據結果如下圖所示。 

 

數據重構后的結果。

此時,每一行是一個州在不同年份的數據。 

責任編輯:龐桂玉 來源: 36大數據
相關推薦

2011-04-08 10:43:44

2009-08-04 08:32:06

Linux Find命Linux Find使用方法

2009-11-24 09:26:31

pbr策略路由

2010-11-19 09:56:38

SQLiteAndroid

2010-09-24 17:08:03

SQL Server唯

2023-07-03 15:55:05

語法jpa狀態

2010-08-06 13:37:28

Flex[Bindab

2023-11-10 08:17:01

分布式搜索引擎

2012-01-13 09:55:54

jQuery

2011-02-24 13:09:10

FireFTP

2023-05-11 08:00:44

Golangsync.Pool

2009-08-24 16:56:26

ASP.NET Log

2009-12-24 16:36:06

WPF InkCanv

2009-09-04 09:04:54

VMware虛擬機軟件

2023-06-28 08:34:02

Bind()函數JavaScript

2009-08-11 09:26:06

2011-09-06 09:26:03

2009-12-28 13:28:03

WPF視頻

2010-05-28 19:12:09

MySQL使用方法
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 狠狠色综合久久婷婷 | 亚洲一区精品视频 | 7777奇米影视 | 国产一区亚洲二区三区 | 黄免费看 | 四虎成人在线播放 | 日韩av网址在线观看 | 亚洲一区久久 | 久久精品超碰 | aⅴ色国产 欧美 | 国产亚洲成av人片在线观看桃 | 久久av网站 | 国产激情91久久精品导航 | 最新中文字幕一区 | 天天插天天狠天天透 | 在线观看电影av | 免费一看一级毛片 | 成人黄视频在线观看 | 涩涩视频网站在线观看 | 成年人精品视频在线观看 | 欧美成人精品一区二区男人看 | 在线观看中文字幕视频 | 欧美精品一区在线 | 亚洲欧美精品一区 | 中文字幕第二十页 | 日韩一区二区在线视频 | 国产亚洲精品美女久久久久久久久久 | 日皮视频免费 | 亚洲精品国产a久久久久久 午夜影院网站 | 毛片免费在线 | 色视频在线免费观看 | 日韩欧美在 | 在线欧美小视频 | 日韩国产中文字幕 | 中文字幕11页 | 亚洲一区在线日韩在线深爱 | 久久一区二区三区四区 | 欧美成人一区二免费视频软件 | 午夜影院网站 | 久久精品国产久精国产 | 国产一级影片 |