深度揭露Oracle索引使用中的限制
筆者認(rèn)為對于數(shù)據(jù)庫索引的作用,應(yīng)該分兩面看。除了肯定其對數(shù)據(jù)庫性能帶來的正面影響外,還需要認(rèn)識到其可能帶來的負(fù)面影響。只有如此,數(shù)據(jù)庫管理員才能夠在正確的場合使用正確的索引。要知道有時(shí)候一個(gè)錯(cuò)誤的索引可能引發(fā)死鎖,并導(dǎo)致數(shù)據(jù)庫性能的急劇下降或進(jìn)程終止;而如果數(shù)據(jù)庫管理員能夠做出一個(gè)正確的判斷的話,那么可以使那些本來要運(yùn)行幾個(gè)小時(shí)甚至一天的進(jìn)程在幾分鐘之內(nèi)就能夠完成。所以這兩個(gè)差距是一個(gè)天上、一個(gè)地下。故筆者希望通過這篇文章能夠讓各位讀者了解索引在使用過程中的限制,了解索引并不是萬能的。
一、索引對數(shù)據(jù)庫性能的影響跟數(shù)據(jù)選擇性直接掛鉤。
當(dāng)用戶從數(shù)據(jù)表中查詢數(shù)據(jù)時(shí),Oracle數(shù)據(jù)庫提供了兩種查詢的方式。一是從表中讀取每一行,就是大家常說的全表掃描;二是通過ROWID一此讀取一行。當(dāng)表中記錄比較多的時(shí)候,很明顯第二種方式能夠更快的定位記錄內(nèi)容。而索引其實(shí)就是建立在這個(gè)查詢原理之上的。如現(xiàn)在某個(gè)表中有300多萬條記錄,而現(xiàn)在用戶可能只需要了解其中的10條記錄信息。此時(shí)如果使用索引標(biāo)識讀取的塊,則可以執(zhí)行比較少的I/O,數(shù)據(jù)庫系統(tǒng)會很快找到用戶所需要的內(nèi)容。而如果沒有使用索引的話,則需要讀取表中所有的塊。
如果在這個(gè)表中加入了索引,那么到底對數(shù)據(jù)庫的性能影響有多大呢?這個(gè)就不好說了,因?yàn)槠涓芏嘁蛩叵嚓P(guān)。如跟數(shù)據(jù)選擇性直接相關(guān)。如果用戶的數(shù)據(jù)非常具有選擇性,則表中家功能只有很少的行匹配索引值,則Oracle將能夠快速查詢匹配所引值得ROWID的索引,并且可以快速查詢少量的相關(guān)表快。如還是上面這個(gè)表中,其如果存儲有某個(gè)市的所有常住人口信息,其中身份證號碼肯定是少不了的。如此時(shí)用戶想根據(jù)身份證號碼來查詢某個(gè)人的信息時(shí),那么數(shù)據(jù)庫能夠在很短的時(shí)間內(nèi)給出響應(yīng)。這主要是因?yàn)橛脩籼峁┑臄?shù)據(jù)非常具有選擇性,基本上跟數(shù)據(jù)庫中的索引值是一一對應(yīng)的。而如果用戶想通過出身年月信息來查詢信息的話,則其數(shù)據(jù)庫反映的速度就會比較慢了。
可見索引對數(shù)據(jù)庫性能的影響直接跟數(shù)據(jù)的選擇性掛鉤。這對于數(shù)據(jù)庫管理員設(shè)計(jì)索引時(shí)很有啟發(fā)性。如數(shù)據(jù)庫管理員在設(shè)計(jì)索引時(shí),最好能夠選擇哪些具有唯一性的字段或者重復(fù)性比較少的字段。如此的話,索引對于數(shù)據(jù)庫性能來說才有比較大的價(jià)值。
二、索引效果跟數(shù)據(jù)庫中記錄的具體存儲位置相關(guān)。
還是上面這張表中,如果現(xiàn)在用戶想查找年齡超過100歲的老人,要對他們?nèi)ミM(jìn)行慰問。假設(shè)現(xiàn)在符合這個(gè)條件的人只有10人。那么此時(shí)索引對數(shù)據(jù)庫性能會有怎么樣的影響呢?此時(shí)顯然數(shù)據(jù)非常具有選擇性,但是并不一定索引能夠起到很好的效果。這還要看其具體存儲的位置。如果這十條記錄在硬盤中存儲的物理位置比較近,如可能在同一個(gè)扇區(qū)之內(nèi),則此時(shí)索引對于數(shù)據(jù)庫性能的影響就會比較大,能夠在最短時(shí)間內(nèi)找到符合條件的數(shù)據(jù)。但是如果相關(guān)的行在表中存儲的位置并不互相靠近,則這個(gè)索引的效果就會逐漸減少。因?yàn)槿绻ヅ渌饕档臄?shù)據(jù)分散在硬盤上的多個(gè)酷愛時(shí),則必須從表中選擇多個(gè)單獨(dú)的塊以滿足查詢。
數(shù)據(jù)庫管理員對于這一點(diǎn)要特別注意。因?yàn)榇藭r(shí)如果數(shù)據(jù)庫管理員查用了索引的話,那么很可能是畫蛇添足。筆者建議,當(dāng)數(shù)據(jù)庫管理員發(fā)現(xiàn)數(shù)據(jù)分散在表的多個(gè)塊的時(shí)候,最好是不要使用索引,而是執(zhí)行全表掃描。此時(shí)執(zhí)行掃描反而會比執(zhí)行索引的效率更高。因?yàn)樵趫?zhí)行全表掃描的時(shí)候,Oracle數(shù)據(jù)庫系統(tǒng)會使用多塊讀取以加速掃描表。而如果采用索引的話,則其讀取數(shù)據(jù)時(shí)是單塊讀取的。而由于數(shù)據(jù)存儲在多個(gè)塊中,所以其讀取的速度反而會更慢。
由此可見,Oracle數(shù)據(jù)庫管理員在數(shù)據(jù)庫設(shè)計(jì)與日常維護(hù)中,也要想辦法能夠讓數(shù)據(jù)盡量存儲在臨近的位置。如盡量減少在同一個(gè)服務(wù)器中不要部署不同的應(yīng)用服務(wù),防止硬盤產(chǎn)生過多的磁盤碎片;如需要采用多塊硬盤的話,則最好通過表空間把類似的表放在同一個(gè)表空間中,從而讓相關(guān)的行在表zhognd存儲位置盡量靠近,以提高索引的使用效果。也就是說,數(shù)據(jù)庫管理員在使用索引的時(shí)候,為表中的字段建立了索引這只是其工作的第一步。在后續(xù)數(shù)據(jù)庫維護(hù)與調(diào)整的過程中,仍然要注意數(shù)據(jù)存儲位置對索引的影響。
【編輯推薦】