Supprimer des enregistrements en double dans SQL Server?

Envisager une colonne nommée EmployeeName table Employee. L'objectif est de supprimer répété records, basé sur la EmployeeName champ.

EmployeeName
------------
Anand
Anand
Anil
Dipak
Anil
Dipak
Dipak
Anil

L'aide d'une requête, je veux supprimer les enregistrements qui sont répétés.

Comment cela peut-il être fait avec TSQL dans SQL Server?

Tu veux dire supprimer les enregistrements en double, droite?
vous pouvez sélectionner les valeurs distinctes et leurs Id et supprimer les enregistrements dont les Id ne sont pas déjà dans la liste sélectionnée?
avez-vous une colonne d'ID unique?
Non je n'ai pas la colonne d'ID Unique
comment avez-vous accepter la réponse donnée par John Gibb, si la table manque d'identifiant unique? où est le empId colonne dans votre exemple utilisé par John ?
Si vous ne disposez pas d'un ID unique colonne, ou n'importe quoi d'autre d'utile à faire une commande d'ici, vous pouvez également commander par la employeename colonne, de sorte que votre rn serait row_number() over (partition by EmployeeName order by EmployeeName)... ce serait choisir l'arbitraire d'un seul enregistrement pour chaque nom.
Double Possible de Comment puis-je supprimer les doublons de lignes?

InformationsquelleAutor usr021986 | 2010-07-23

201

Vous pouvez le faire avec les fonctions de la fenêtre. Il commande les dupes par empId, et de supprimer toutes les mais la première.
```
delete x from (
  select *, rn=row_number() over (partition by EmployeeName order by empId)
  from Employee 
) x
where rn > 1;
```
L'exécuter en tant que, sélectionnez pour voir ce qui pourrait être supprimé:
```
select *
from (
  select *, rn=row_number() over (partition by EmployeeName order by empId)
  from Employee 
) x
where rn > 1;
```
- très intelligent....
- Si vous n'avez pas de clé primaire, vous pouvez utiliser ORDER BY (SELECT NULL) stackoverflow.com/a/4812038
InformationsquelleAutor John Gibb
32

En supposant que votre table Employee a également une colonne unique (ID dans l'exemple ci-dessous), le travail:
```
delete from Employee 
where ID not in
(
    select min(ID)
    from Employee 
    group by EmployeeName 
);
```
Cela laissera la version avec le plus bas de l'ID dans la table.

Modifier

Re McGyver du commentaire de SQL 2012

MIN peut être utilisé avec le numérique, char, varchar, de type uniqueidentifier, ou des colonnes datetime, mais pas avec les colonnes de bit

Pour 2008 R2 et plus tôt,

MIN peut être utilisé avec le numérique, de type char, varchar ou des colonnes datetime, mais pas avec les colonnes de bit (et elle aussi ne fonctionne pas avec un GUID)

Pour 2008R2 vous aurez besoin de lancer le GUID à un type pris en charge par MIN, par exemple
```
delete from GuidEmployees
where CAST(ID AS binary(16)) not in
(
    select min(CAST(ID AS binary(16)))
    from GuidEmployees
    group by EmployeeName 
);
```
SqlFiddle pour divers types de Sql 2008

SqlFiddle de différents types dans Sql 2012
- Aussi, Oracle, vous pouvez utiliser "rowid" si il n'y a aucune autre colonne d'id unique.
- +1, Même si il n'y avait pas une colonne d'ID, on pourrait être ajouté comme un champ d'identité.
- Excellente réponse. Fort et efficace. Même si la table n'a pas de papiers d'identité, il est préférable d'inclure un pour exécuter cette méthode.
InformationsquelleAutor StuartLC
8

Vous pouvez essayer quelque chose comme ce qui suit:
```
delete T1
from MyTable T1, MyTable T2
where T1.dupField = T2.dupField
and T1.uniqueField > T2.uniqueField  
```
(cela suppose que vous avez un nombre entier en fonction champ unique)

Personnellement je dirais qu'il valait mieux essayer de corriger le fait que les entrées en double sont ajoutés à la base de données avant qu'il ne se produit plutôt que comme un poste fix-it opération.
- Je n ' avez pas de champ unique(ID) dans ma Table. Comment puis-je effectuer l'opération puis.
InformationsquelleAutor Ben Cawley

DELETE
FROM MyTable
WHERE ID NOT IN (
     SELECT MAX(ID)
     FROM MyTable
     GROUP BY DuplicateColumn1, DuplicateColumn2, DuplicateColumn3)

WITH TempUsers (FirstName, LastName, duplicateRecordCount)
AS
(
    SELECT FirstName, LastName,
    ROW_NUMBER() OVER (PARTITIONBY FirstName, LastName ORDERBY FirstName) AS duplicateRecordCount
    FROM dbo.Users
)
DELETE
FROM TempUsers
WHERE duplicateRecordCount > 1

InformationsquelleAutor Kumar Manish-PMP

2
```
WITH CTE AS
(
   SELECT EmployeeName, 
          ROW_NUMBER() OVER(PARTITION BY EmployeeName ORDER BY EmployeeName) AS R
   FROM employee_table
)
DELETE CTE WHERE R > 1;
```
La magie des expressions de table communes.
- Sous-portail / a_horse_with_no_name - ne devrait-ce pas être une sélection dans une table réelle? Aussi, la fonction ROW_NUMBER devrait être ROW_NUMBER() parce que c'est une fonction, c'est exact?
InformationsquelleAutor Mostafa Elmoghazi

Essayer

DELETE
FROM employee
WHERE rowid NOT IN (SELECT MAX(rowid) FROM employee
GROUP BY EmployeeName);

InformationsquelleAutor Anurag Garg

Si vous êtes à la recherche d'un moyen de supprimer les doublons, mais vous avez une clé étrangère pointant vers la table avec des doublons, vous pouvez prendre les méthodes suivantes à l'aide d'une lente mais efficace curseur.

Il va déménager le des doubles de clés sur la table de clés étrangères.

create table #properOlvChangeCodes(
    id int not null,
    name nvarchar(max) not null
)

DECLARE @name VARCHAR(MAX);
DECLARE @id INT;
DECLARE @newid INT;
DECLARE @oldid INT;

DECLARE OLVTRCCursor CURSOR FOR SELECT id, name FROM Sales_OrderLineVersionChangeReasonCode; 
OPEN OLVTRCCursor;
FETCH NEXT FROM OLVTRCCursor INTO @id, @name;
WHILE @@FETCH_STATUS = 0  
BEGIN  
        -- determine if it should be replaced (is already in temptable with name)
        if(exists(select * from #properOlvChangeCodes where Name=@name)) begin
            -- if it is, finds its id
            Select  top 1 @newid = id
            from    Sales_OrderLineVersionChangeReasonCode
            where   Name = @name

            -- replace terminationreasoncodeid in olv for the new terminationreasoncodeid
            update Sales_OrderLineVersion set ChangeReasonCodeId = @newid where ChangeReasonCodeId = @id

            -- delete the record from the terminationreasoncode
            delete from Sales_OrderLineVersionChangeReasonCode where Id = @id
        end else begin
            -- insert into temp table if new
            insert into #properOlvChangeCodes(Id, name)
            values(@id, @name)
        end

        FETCH NEXT FROM OLVTRCCursor INTO @id, @name;
END;
CLOSE OLVTRCCursor;
DEALLOCATE OLVTRCCursor;

drop table #properOlvChangeCodes

InformationsquelleAutor Peter

Voici une belle façon de dédoublonner les enregistrements dans une table qui a une colonne d'identité basée sur un clé primaire que vous pouvez définir à l'exécution. Avant de me lancer, je vais remplir un échantillon de données pour travailler avec l'aide du code suivant:

if exists (select 1 from sys.all_objects where type='u' and name='_original')
drop table _original

declare @startyear int = 2017
declare @endyear int = 2018
declare @iterator int = 1
declare @income money = cast((SELECT round(RAND()*(5000-4990)+4990 , 2)) as money)
declare @salesrepid int = cast(floor(rand()*(9100-9000)+9000) as varchar(4))
create table #original (rowid int identity, monthyear varchar(max), salesrepid int, sale money)
while @iterator<=50000 begin
insert #original 
select (Select cast(floor(rand()*(@endyear-@startyear)+@startyear) as varchar(4))+'-'+ cast(floor(rand()*(13-1)+1) as varchar(2)) ),  @salesrepid , @income
set  @salesrepid  = cast(floor(rand()*(9100-9000)+9000) as varchar(4))
set @income = cast((SELECT round(RAND()*(5000-4990)+4990 , 2)) as money)
set @iterator=@iterator+1
end  
update #original
set monthyear=replace(monthyear, '-', '-0') where  len(monthyear)=6

select * into _original from #original

Prochaine je vais créer un nouveau Type de ColumnNames:

create type ColumnNames AS table   
(Columnnames varchar(max))

Enfin, je vais créer une procédure stockée avec les 3 suivants en garde:
1. Le proc va prendre un paramètre obligatoire @nom de la table qui définit le nom de la table que vous êtes en train de supprimer à partir de votre base de données.
2. Le proc est un paramètre facultatif @colonnes que vous pouvez utiliser pour définir les champs qui constituent le principal désiré clé que vous supprimez contre. Si ce champ est laissé vide, il est supposé que tous les champs en plus de la colonne d'identité constituent le principal désiré clé.
3. Lorsque des doublons sont supprimés, le record de la plus faible valeur dans la colonne d'identité sera maintenue.

Voici mon delete_dupes stockées proc:

 create proc delete_dupes (@tablename varchar(max), @columns columnnames readonly) 
as
begin
declare @table table (iterator int, name varchar(max), is_identity int)
declare @tablepartition table (idx int identity, type varchar(max), value varchar(max))
declare @partitionby varchar(max)  
declare @iterator int= 1 
if exists (select 1 from @columns)  begin
declare @columns1 table (iterator int, columnnames varchar(max))
insert @columns1
select 1, columnnames from @columns
set @partitionby = (select distinct 
substring((Select ', '+t1.columnnames 
From @columns1 t1
Where T1.iterator = T2.iterator
ORDER BY T1.iterator
For XML PATH ('')),2, 1000)  partition
From @columns1 T2 )
end
insert @table 
select 1, a.name, is_identity from sys.all_columns a join sys.all_objects b on a.object_id=b.object_id
where b.name = @tablename  
declare @identity varchar(max)= (select name from @table where is_identity=1)
while @iterator>=0 begin 
insert @tablepartition
Select          distinct case when @iterator=1 then 'order by' else 'over (partition by' end , 
substring((Select ', '+t1.name 
From @table t1
Where T1.iterator = T2.iterator and is_identity=@iterator
ORDER BY T1.iterator
For XML PATH ('')),2, 5000)  partition
From @table T2
set @iterator=@iterator-1
end 
declare @originalpartition varchar(max)
if @partitionby is null begin
select @originalpartition  = replace(b.value+','+a.type+a.value ,'over (partition by','')  from @tablepartition a cross join @tablepartition b where a.idx=2 and b.idx=1
select @partitionby = a.type+a.value+' '+b.type+a.value+','+b.value+') rownum' from @tablepartition a cross join @tablepartition b where a.idx=2 and b.idx=1
end
else
begin
select @originalpartition=b.value +','+ @partitionby from @tablepartition a cross join @tablepartition b where a.idx=2 and b.idx=1
set @partitionby = (select 'OVER (partition by'+ @partitionby  + ' ORDER BY'+ @partitionby + ','+b.value +') rownum'
from @tablepartition a cross join @tablepartition b where a.idx=2 and b.idx=1)
end
exec('select row_number() ' + @partitionby +', '+@originalpartition+' into ##temp from '+ @tablename+'')
exec(
'delete a from _original a 
left join ##temp b on a.'+@identity+'=b.'+@identity+' and rownum=1  
where b.rownum is null')
drop table ##temp
end

Une fois que cela est respecté, vous pouvez supprimer les enregistrements en double en exécutant le proc. Pour supprimer des doublons sans définir souhaité clé primaire utilisation de cet appel:

exec delete_dupes '_original'

Pour supprimer dupes basé sur un définies souhaité clé primaire utilisation de cet appel:

declare @table1 as columnnames
insert @table1
values ('salesrepid'),('sale')
exec delete_dupes '_original' , @table1

InformationsquelleAutor Daniel Marcus

-1

Veuillez voir ci-dessous la suppression trop.

Declare @Employee table (EmployeeName varchar(10))
Insert into @Employee values 
('Anand'),('Anand'),('Anil'),('Dipak'),
('Anil'),('Dipak'),('Dipak'),('Anil')
Select * from @Employee

Supprimer des enregistrements en double dans SQL Server?

Créé un exemple de table nommée @Employee et chargé avec des données fournies.

Delete  aliasName from (
Select  *,
ROW_NUMBER() over (Partition by EmployeeName order by EmployeeName) as rowNumber
From    @Employee) aliasName 
Where   rowNumber > 1
Select * from @Employee

Résultat:

Supprimer des enregistrements en double dans SQL Server?

Je sais, c'est demandé il y a six ans, de poster juste au cas où il est utile pour n'importe qui.

InformationsquelleAutor Jithin Shaji

Vous devez vous connecter pour publier un commentaire.