Oracle幾種查找和刪除重復記錄的方法總結
oracle數據庫是一種大型數據庫系統,一般應用于商業,政府部門,它的功能很強大,能夠處理大批量的數據,在網絡方面也用的非常多。Oracle數據庫中有時會出現一些重復記錄,顧名思義,重復記錄就是重復的內容沒有什么存在的意義,就要將其刪除,以節省更多的空間內存,下文中將為大家介紹Oracle幾種查找和刪除重復記錄的方法總結。
平時工作中可能會遇到當試圖對庫表中的某一列或幾列創建唯一索引時,系統提示 ORA-01452 :不能創建唯一索引,發現重復記錄。
下面總結一下幾種查找和刪除重復記錄的方法(以表CZ為例):
表CZ的結構如下:
SQL> desc cz Name Null? Type ------------------------------------------------------------------- C1 NUMBER(10) C10 NUMBER(5) C20 VARCHAR2(3) 刪除重復記錄的方法原理:
(1).在Oracle中,每一條記錄都有一個rowid,rowid在整個數據庫中是唯一的,rowid確定了每條記錄是在Oracle中的哪一個數據文件、塊、行上。
(2).在重復的記錄中,可能所有列的內容都相同,但rowid不會相同,所以只要確定出重復記錄中那些具有最大rowid的就可以了,其余全部刪除。
重復記錄判斷的標準是:
C1,C10和C20這三列的值都相同才算是重復記錄。
經查看表CZ總共有16條記錄:
SQL>set pagesize 100 SQL>select * from cz; C1 C10 C20 ---------- ---------- --- 1 2 dsf 1 2 dsf 1 2 dsf 1 2 dsf 2 3 che 1 2 dsf 1 2 dsf 1 2 dsf 1 2 dsf 2 3 che 2 3 che 2 3 che 2 3 che 3 4 dff 3 4 dff 3 4 dff 4 5 err 5 3 dar 6 1 wee 7 2 zxc 20 rows selected. 1.查找重復記錄的幾種方法:
(1).SQL>select * from cz group by c1,c10,c20 having count(*) >1;
C1 C10 C20 ----------------------- 1 2 dsf 2 3 che 3 4 dff (2).SQL>select distinct * from cz;
C1 C10 C20 ----------------------- 1 2 dsf 2 3 che 3 4 dff (3).SQL>select * from cz a where rowid=(select max(rowid) from cz where c1=a.c1 and c10=a.c10 and c20=a.c20);
C1 C10 C20 ----------------------- 1 2 dsf 2 3 che 3 4 dff 2.刪除重復記錄的幾種方法:
(1).適用于有大量重復記錄的情況(在C1,C10和C20列上建有索引的時候,用以下語句效率會很高):
SQL>delete from cz where (c1,c10,c20) in (select c1,c10,c20 from cz group by c1,c10,c20 having count(*)>1) and rowid not in (select min(rowid) from cz group by c1,c10,c20 having count(*)>1); SQL>delete fron cz where rowid not in(select min(rowid) from cz group by c1,c10,c20); (2).適用于有少量重復記錄的情況(注意,對于有大量重復記錄的情況,用以下語句效率會很低):
SQL>delete from cz a where a.rowid!=(select max(rowid) from cz b where a.c1=b.c1 and a.c10=b.c10 and a.c20=b.c20); SQL>delete from cz a where a.rowid<(select max(rowid) from cz b where a.c1=b.c1 and a.c10=b.c10 and a.c20=b.c20); SQL>delete from cz a where rowid <(select max(rowid) from cz where c1=a.c1 and c10=a.c10 and c20=a.c20); (3).適用于有少量重復記錄的情況(臨時表法):
SQL>create table test as select distinct * from cz; (建一個臨時表test用來存放重復的記錄)
SQL>truncate table cz; (清空cz表的數據,但保留cz表的結構)
SQL>insert into cz select * from test; (再將臨時表test里的內容反插回來)
(4).適用于有大量重復記錄的情況(Exception into 子句法):
采用alter table 命令中的 Exception into 子句也可以確定出庫表中重復的記錄。這種方法稍微麻煩一些,為了使用“excepeion into ”子句,必須首先創建 EXCEPTIONS 表。創建該表的 SQL 腳本文件為 utlexcpt.sql 。對于win2000系統和 UNIX 系統, Oracle 存放該文件的位置稍有不同,在win2000系統下,該腳本文件存放在$ORACLE_HOME\Ora90\rdbms\admin 目錄下;而對于 UNIX 系統,該腳本文件存放在$ORACLE_HOME/rdbms/admin 目錄下。
到這里關于Oracle數據庫中重復記錄的查找和刪除的方法就為大家講解完了,希望大家通過上文中介紹的對于介紹的方法能夠有所了解,這樣大家在以后的工作中遇到類似問題就能夠輕松解決了。