文/夏翔
開發(fā)人員的噩夢——刪除重復(fù)記錄想必每一位開發(fā)人員都有過類似的經(jīng)歷,在對數(shù)據(jù)庫進行查詢或統(tǒng)計的時候不時地會碰到由于表中存在重復(fù)的記錄而導(dǎo)致查詢和統(tǒng)計結(jié)果不準確。解決該問題的辦法就是將這些重復(fù)的記錄刪除,只保留其中的一條。在SQL Server中除了對擁有十幾條記錄的表進行人工刪除外,實現(xiàn)刪除重復(fù)記錄一般都是寫一段代碼,用游標的方法一行一行檢查,刪除重復(fù)的記錄。因為這種方法需要對整個表進行遍歷,所以對于表中的記錄數(shù)不是很大的時候還是可行的,如果一張表的數(shù)據(jù)達到上百萬條,用游標的方法來刪除簡直是個噩夢,因為它會執(zhí)行相當(dāng)長的一段時間。
四板斧——輕松消除重復(fù)記錄殊不知在SQL Server中有一種更為簡單的方法,它不需要用游標,只要寫一句簡單插入語句就能實現(xiàn)刪除重復(fù)記錄的功能。為了能清楚地表述,我們首先假設(shè)存在一個產(chǎn)品信息表Products,其表結(jié)構(gòu)如下:CREATE TABLE Products (ProductID int,ProductName nvarchar (40),Unit char(2),UnitPrice money)表中的數(shù)據(jù)如圖1:

圖表圖1中可以看出,產(chǎn)品Chang和Tofu的記錄在產(chǎn)品信息表中存在重復(fù)。現(xiàn)在要刪除這些重復(fù)的記錄,只保留其中的一條。步驟如下:第一板斧——建立一張具有相同結(jié)構(gòu)的臨時表CREATE TABLE Products_temp (ProductID int,ProductName nvarchar (40),Unit char(2),UnitPrice money)第二板斧——為該表加上索引,并使其忽略重復(fù)的值方法是在企業(yè)管理器中找到上面建立的臨時表Products _temp,單擊鼠標右鍵,選擇所有任務(wù),選擇管理索引,選擇新建。如圖2所示。按照圖2中圈出來的地方設(shè)置索引選項。圖2第三板斧——拷貝產(chǎn)品信息到臨時表insert into Products_temp Select * from Products此時SQL Server會返回如下提示:服務(wù)器: 消息 3604,級別 16,狀態(tài) 1,行 1已忽略重復(fù)的鍵。它表明在產(chǎn)品信息臨時表Products_temp中不會有重復(fù)的行出現(xiàn)。第四板斧——將新的數(shù)據(jù)導(dǎo)入原表將原產(chǎn)品信息表Products清空,并將臨時表Products_temp中數(shù)據(jù)導(dǎo)入,最后刪除臨時表Products_temp。delete Productsinsert into Products select * from Products_tempdrop table Products_temp這樣就完成了對表中重復(fù)記錄的刪除。無論表有多大,它的執(zhí)行速度都是相當(dāng)快的,而且因為幾乎不用寫語句,所以它也是很安全的。小提示:上述方法中刪除重復(fù)記錄取決于創(chuàng)建唯一索引時選擇的字段,在實際的操作過程中讀者務(wù)必首先確認創(chuàng)建的唯一索引字段是否正確,以免將有用的數(shù)據(jù)刪除。