使用Access 2007進(jìn)行數(shù)據(jù)挖掘
什么是數(shù)據(jù)挖掘
專家會(huì)告訴你,數(shù)據(jù)挖掘是使用自動(dòng)化技術(shù)在企業(yè)斥資獲得的數(shù)據(jù)庫(kù)中建立有用的趨勢(shì)/信息。一旦得到了,這個(gè)信息就會(huì)被用來(lái)改進(jìn)商業(yè)操作或制定更好的商業(yè)決策。涉及的技術(shù)有很多,包括聯(lián)合分析、集群、分類、模糊邏輯、神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)清理等。然后這些技術(shù)與可視化工具聯(lián)系在一起,這些可視化工具包括報(bào)表、圖表、OLAP和其它的工具。
有專家來(lái)進(jìn)行數(shù)據(jù)挖掘是很好,但是其它人群(占99%),那些既不懂?dāng)?shù)據(jù)挖掘又沒(méi)有時(shí)間和資金來(lái)獲得專業(yè)數(shù)據(jù)挖掘工具用于他們的數(shù)據(jù)庫(kù)的人們?cè)撛趺崔k呢?他們能夠做什么?
為什么不使用流行的Microsoft Access工具而不是新工具來(lái)探究我們的數(shù)據(jù)庫(kù)呢?首先,Access與Microsoft Office/Excel中的圖表工具緊密集成在一起(見(jiàn)圖1)。Access所使用的圖表工具和Excel所使用的工具很類似;主要的不同是Access使用查詢而Excel使用單元。其次,Access支持工業(yè)級(jí)SQL查詢,并且其通過(guò)Links可以被任何種類的數(shù)據(jù)庫(kù)——從文本文件、電子數(shù)據(jù)表、SharePoint Lists、SQL server、Oracle、MySQL等等——當(dāng)作一個(gè)客戶端應(yīng)用程序。在它之上,設(shè)計(jì)良好的表單和VBA可以幫助你建立一個(gè)界面,從而為你的用戶提供便利,使得他們能夠開(kāi)始靠他們自己研究他們的數(shù)據(jù)。
在Access 2007中有一些創(chuàng)新,這些創(chuàng)新將幫助人們探究他們的數(shù)據(jù)。這包括在Access 2007和Excel 2007中的非常類似的數(shù)據(jù)過(guò)濾界面;在用戶界面上透視圖、透視表是非常有用的,而交互過(guò)濾器現(xiàn)在在Access報(bào)表中也可以使用了。
圖1 – 透視圖中可用的圖表類型示意
在開(kāi)始講述不同工具的例子之前,圖2顯示了用來(lái)創(chuàng)建本篇文章中的圖表的示例數(shù)據(jù)。
圖2 – 示例數(shù)據(jù)
在查詢和表單中過(guò)濾數(shù)據(jù)
所以我們?cè)鯓訉ccess當(dāng)作一個(gè)數(shù)據(jù)挖掘工具呢?事實(shí)是隨著Access 95的問(wèn)世,它為表和查詢提供了Filter By Selection和Filter by form,從而就有了一組基本的數(shù)據(jù)探究工具可用在查詢和表格里。
例如,F(xiàn)ilter by Selection是一個(gè)演示你可以怎樣探究數(shù)據(jù)的主要示例。右鍵單擊年份(比如2008)并選擇Filter by Selection,你將只顯示這個(gè)月的銷售。Filter by Selection是最重要的數(shù)據(jù)挖掘技術(shù)中很基本的一個(gè)——一個(gè)向下鉆取。它是到這個(gè)框架之中,在Access 2007中對(duì)用戶界面進(jìn)行過(guò)濾來(lái)匹配Excel數(shù)據(jù)過(guò)濾而做的改變使得Access成為了一個(gè)更加通用的工具。這在圖3中做了說(shuō)明,顯示了新的過(guò)濾界面。
圖3 – 現(xiàn)在在Access 2007中的過(guò)濾和Excel非常類似
#p#
在查詢中添加總計(jì)
如果你想過(guò)濾數(shù)據(jù),那么這有一個(gè)非常新的創(chuàng)新,它將回答你的大多數(shù)數(shù)據(jù)問(wèn)題,它就是Totals。當(dāng)你打開(kāi)一個(gè)查詢,在Home Ribbon中你將找到一個(gè)Totals按鈕。點(diǎn)擊它就會(huì)有一個(gè)額外的記錄添加到你的查詢中,如圖4所示。現(xiàn)在你可以右鍵單擊這個(gè)新的記錄并添加Sums或Averages或Counts之類的東西。這個(gè)創(chuàng)新真的很有用,因?yàn)橐郧翱偸窃谶^(guò)濾之后復(fù)制黏貼到Excel中去計(jì)算總和。
圖4 – 添加一個(gè)Totals記錄到一個(gè)Access查詢中會(huì)降低對(duì)額外報(bào)表或復(fù)制到Excel的需求
將你的查詢轉(zhuǎn)換成數(shù)據(jù)透視表用于更深入的研究
在Access的之前版本中,當(dāng)你查看一個(gè)查詢中的數(shù)據(jù)時(shí),你在查詢界面中處理排序和過(guò)濾之外就幾乎什么都不能做了。在Access 2007中,你現(xiàn)在可以將這個(gè)查詢轉(zhuǎn)換成一個(gè)直接的交互透視網(wǎng)格視圖,它具有大量更進(jìn)一步的數(shù)據(jù)探究選擇。如果你看了圖5,你會(huì)看到當(dāng)你按這種方式瀏覽查詢時(shí)你所得到的界面。此外,當(dāng)你從一個(gè)普通查詢視圖轉(zhuǎn)到一個(gè)數(shù)據(jù)透視表視圖時(shí),你所使用的過(guò)濾器仍然在使用。
圖5 – 在數(shù)據(jù)透視表視圖中瀏覽查詢
將你的查詢轉(zhuǎn)換成數(shù)據(jù)透視圖表用于更深入的研究
像直接以數(shù)據(jù)透視表的方式來(lái)查看查詢一樣,你可以以數(shù)據(jù)透視圖表的方式來(lái)查看它們,并使用和數(shù)據(jù)透視表相同的字段和過(guò)濾界面。同時(shí)這也是一個(gè)有用的工具,它要求用戶了解查詢,從而確保將要提取出來(lái)的數(shù)據(jù)是適用于這個(gè)圖表視圖的。所以如果有了解數(shù)據(jù)庫(kù)模型的Access專家坐下來(lái)與圖表用戶一起確認(rèn)他們?cè)谝哉_的方式來(lái)獲取信息,那么這是很好的。通常只要有一兩個(gè)好的示例就足夠激發(fā)管理層用戶的創(chuàng)造性了。此外,如果你告訴管理層用戶數(shù)據(jù)透視視圖使用起來(lái)是和Excel透視一樣的話,他們會(huì)很振奮的。
圖6 – 在數(shù)據(jù)透視圖表視圖中查看圖表形式的查詢
注意,你可以合并透視到表單和報(bào)表中作為子報(bào)表,但是你需要設(shè)置這個(gè)子報(bào)表的默認(rèn)視圖屬性為正確的視圖并允許這種類型的視圖。
#p#
在使用中過(guò)濾報(bào)表
在Access 2007中,現(xiàn)在報(bào)表可以在它們將要顯示時(shí)被過(guò)濾;這使得你可以使你的報(bào)表更加強(qiáng)大而幾乎不用做什么修改。要這么做,你可以通過(guò)右鍵單擊報(bào)表中的一個(gè)字段來(lái)采用這些過(guò)濾選項(xiàng)(它們使用起來(lái)就像查詢一樣),如圖7中所做的。
圖7 – 通過(guò)過(guò)濾一個(gè)Access 2007報(bào)表來(lái)探究數(shù)據(jù)
Microsoft Graphs
現(xiàn)在,你探究數(shù)據(jù)的***一個(gè)方法是要使用Microsoft Graph,而這是更加專業(yè)的編程人員的領(lǐng)域。使用MS Graph,當(dāng)你有大量數(shù)據(jù)時(shí),要查看各個(gè)記錄的數(shù)據(jù)是不太實(shí)際的。所以對(duì)于MS Graph對(duì)象,你將幾乎總是對(duì)二維圖形和交叉表查詢使用合并查詢(group by),這使得你可以以三維形式顯示數(shù)據(jù)。
舉例來(lái)說(shuō),這個(gè)合并查詢計(jì)算了美國(guó)的按月瓶裝銷售,這個(gè)查詢可以被用來(lái)給一個(gè)Microsoft Graph提供記錄來(lái)源。
|
總結(jié) – 那么你可以怎樣開(kāi)始探究你的數(shù)據(jù)庫(kù)呢
對(duì)于專家來(lái)說(shuō),要使這些工具工作起來(lái)的竅門是理解數(shù)據(jù)模型,建立適當(dāng)?shù)牟樵儾⑺鼈儼惭b到用戶界面中。對(duì)于管理層用戶來(lái)說(shuō),竅門可能就是使開(kāi)發(fā)人員對(duì)一個(gè)類似的查詢建立正確工具的一個(gè)良好示例,然后使用它作為一個(gè)原型來(lái)探究你的數(shù)據(jù)。無(wú)論你的方法是什么,你在看過(guò)這些選擇之后都會(huì)同意Access 2007為數(shù)據(jù)挖掘業(yè)余愛(ài)好者添加了一些很酷并有用的工具。
【編輯推薦】