Supprimer les doublons d'une table SQL sans clé primaire

J'ai le tableau ci-dessous avec les enregistrements dans il

create table employee
(
 EmpId number,
 EmpName varchar2(10),
 EmpSSN varchar2(11)
);

insert into employee values(1, 'Jack', '555-55-5555');
insert into employee values (2, 'Joe', '555-56-5555');
insert into employee values (3, 'Fred', '555-57-5555');
insert into employee values (4, 'Mike', '555-58-5555');
insert into employee values (5, 'Cathy', '555-59-5555');
insert into employee values (6, 'Lisa', '555-70-5555');
insert into employee values (1, 'Jack', '555-55-5555');
insert into employee values (4, 'Mike', '555-58-5555');
insert into employee values (5, 'Cathy', '555-59-5555');
insert into employee values (6 ,'Lisa', '555-70-5555');
insert into employee values (5, 'Cathy', '555-59-5555');
insert into employee values (6, 'Lisa', '555-70-5555');

Je n'ai pas de clé primaire de cette table .Mais j'ai ci-dessus enregistre dans ma table déjà.
Je veux supprimer les enregistrements en double qui a la même valeur dans EmpId et EmpSSN champs.

Ex : Emp id 5

Quelqu'un peut-il m'aider à encadrer une requête pour supprimer ces doublons

Merci d'avance

Pouvez-vous AJOUTER une clé primaire?? Ce système de base de données ou utilisez-vous? Oracle? Veuillez l'indiquer dans votre question!
Que faire si il a le même EmpID et EmpSSn, mais des noms différents?
Nous n'avons pas varchar2 dans SQL Server, n'importe quelle version
Hmmm... pas de "nombre", ni "varchar2" sont valables SQL Server 2005 types de données.... sent comme Oracle pour moi.
Cela peut être fait très simplement à l'aide d'un CTE, comme ici

InformationsquelleAutor Shyju | 2009-06-12

54

Ajouter une Clé Primaire (code ci-dessous)

Exécuter le bon de supprimer (code ci-dessous)

Demandez-vous POURQUOI vous woudln veux pas garder cette clé primaire.

En supposant que MSSQL ou compatible:
```
ALTER TABLE Employee ADD EmployeeID int identity(1,1) PRIMARY KEY;

WHILE EXISTS (SELECT COUNT(*) FROM Employee GROUP BY EmpID, EmpSSN HAVING COUNT(*) > 1)
BEGIN
    DELETE FROM Employee WHERE EmployeeID IN 
    (
        SELECT MIN(EmployeeID) as [DeleteID]
        FROM Employee
        GROUP BY EmpID, EmpSSN
        HAVING COUNT(*) > 1
    )
END
```
- +1: pour citer quelques SQL dieu: "si ce n'est pas une clé primaire, ce n'est pas un tableau"
- +1 Une clé primaire identifie une ligne. Pas de PK = pas de sens. @marc_s: un index cluster qui différencie un tableau à partir d'un segment de mémoire. Pas de PK signifie simplement pas de l'intégrité des données
- même un segment est considéré comme un tableau 🙂 Cette citation est plus le long des lignes de: sauf si vous spécifiez une clé primaire d'une table n'a vraiment pas beaucoup d'utilité (sauf dans les cas limites, comme à l'importation en vrac / temporaire tables etc.)
- même dans ces cas limites, j'ai presque toujours ajouter une clé primaire, juste pour que je puisse supprimer dupped recrds en cas de besoin.
- Ressemble à la suppression des doublons est fait de sorte que le EmpID peut être la clé primaire. Les autres données semblent dépendantes.
- J'ai eu le même problème, stupide 2 du tableau de la colonne, ne pas prêter attention. Vous m'avez sauvé!
- Cela permettrait de supprimer les doublons et les non-double rangée. Je crois Nirav Parikh la solution de ne supprimer la ligne en double tout en préservant la ligne d'origine.
InformationsquelleAutor cjk
71

C'est très simple. J'ai essayé dans SQL Server 2008
```
DELETE SUB FROM
(SELECT ROW_NUMBER() OVER (PARTITION BY EmpId, EmpName, EmpSSN ORDER BY EmpId) cnt
 FROM Employee) SUB
WHERE SUB.cnt > 1
```
- Cela fonctionne bien lorsque vous avez un grand nombre de colonnes de groupe, et d'une manière ordonnée traite de l'NULL != NULL lorsque l'on compare les deux colonnes. Vous n'avez pas de liste de chaque colonne deux fois comme certains des autres réponses ("un.col = b.le col" type de chose), et plus important encore, vous n'avez pas à vérifier "((un.col = b.le col) OU (un.le col EST NULLE ET b.le col EST NULL))" sur NULL colonnes.
- Cette réponse fait résout le problème, sans changements structurels. Fonctionne parfaitement.
InformationsquelleAutor Anjib Rajkhowa

Utiliser le numéro de ligne de différencier les enregistrements en double. Garder le premier numéro de ligne pour un EmpID/EmpSSN et supprimer le reste:

    DELETE FROM Employee a
     WHERE ROW_NUMBER() <> ( SELECT MIN( ROW_NUMBER() )
                               FROM Employee b
                              WHERE a.EmpID  = b.EmpID
                                AND a.EmpSSN = b.EmpSSN )

+1 Une bonne solution pour éviter d'avoir à apporter des changements structurels
Il travaillera pour Oracle? J'ai eu ce problème stackoverflow.com/questions/34948301/...

InformationsquelleAutor Paul Morgan

With duplicates

As
(Select *, ROW_NUMBER() Over (PARTITION by EmpID,EmpSSN Order by EmpID,EmpSSN) as Duplicate From Employee)

delete From duplicates

Where Duplicate > 1 ;

Cela permettra de mettre à jour le Tableau et supprimer tous les doublons de la Table!

InformationsquelleAutor Nirav Parikh

8
```
select distinct * into newtablename from oldtablename
```
Maintenant, le newtablename aura pas de doublons.

Simplement changer le nom de la table(newtablename) en appuyant sur F2 dans l'explorateur d'objets de sql server.

InformationsquelleAutor naga vara prasad
6

Vous pouvez créer une table temporaire #tempemployee contenant un select distinct de votre employee table.
Puis delete from employee.
Puis insert into employee select from #tempemployee.

Comme Josh dit - même si vous savez que la doublons, la suppression d'entre eux seront impossile puisque vous ne pouvez pas se réfèrent en fait à un enregistrement spécifique si c'est une copie exacte d'un autre enregistrement.
- Seul truc il y a si les noms sont différents, mais l'ID/SSN match. Vous devez en quelque sorte de choisir une cause distincte ne pas l'y aider.
- +1 c'est la plus simple et la solution portable. L'OP n'indique pas quelle est la marque de base de données qu'il utilise.
- à partir de l'OP de l'échantillon, il semble que ce n'est pas un problème. Les lignes en double sont identiques dans toutes les colonnes.
InformationsquelleAutor Daren Thomas
3

Code
```
DELETE DUP 
FROM 
( 
    SELECT ROW_NUMBER() OVER (PARTITION BY Clientid ORDER BY Clientid ) AS Val 
    FROM ClientMaster 
) DUP 
WHERE DUP.Val > 1
```
Explication

Utiliser une sous-requête pour créer une vue par-dessus la table qui comprend un champ basé sur Row_Number(), partitionné par les colonnes que vous souhaitez être unique.

Supprimer les résultats de cette requête interne, la sélection de tout ce qui n'a pas un numéro de ligne de 1; c'est à dire les doublons; pas l'original.

La order by de la clause de la fonction row_number fonction de fenêtre est nécessaire pour une syntaxe valide; vous pouvez mettre n'importe quel nom de colonne ici. Si vous souhaitez modifier des résultats est considérée comme un doublon (par exemple, de garder les plus anciennes ou plus récentes, etc), la colonne(s) utilisé ici n'importe; c'est à dire que vous voulez spécifier l'ordre telles que l'enregistrement que vous souhaitez conserver viendra d'abord dans le résultat.
- Bienvenue à Débordement de Pile! Code seulement les réponses ne sont pas très utiles sur leur propre. Il serait utile si vous pouviez ajouter quelques détails expliquant comment/pourquoi il répond à la question.
InformationsquelleAutor kamz kamarajan

Si vous ne voulez pas créer une nouvelle clé primaire, vous pouvez utiliser la commande TOP dans SQL Server:

declare @ID int
while EXISTS(select count(*) from Employee group by EmpId having count(*)> 1)
begin
    select top 1 @ID = EmpId
    from Employee 
    group by EmpId
    having count(*) > 1

    DELETE TOP(1) FROM Employee WHERE EmpId = @ID
end

InformationsquelleAutor Joe

SA facilité d'utilisation ci-dessous requête

WITH Dups AS
(
  SELECT col1,col2,col3,
ROW_NUMBER() OVER(PARTITION BY col1,col2,col3 ORDER BY (SELECT 0)) AS rn
 FROM mytable
)
DELETE FROM Dups WHERE rn > 1

InformationsquelleAutor Abhishek Jaiswal

1

supprimer des sous from (select ROW_NUMBER() OVer(Partition by empid commande par empid)cnt de l'employé)sous
où sous la.cnt>1
- Bienvenue sur stackoverflow. C'est une vieille question avec un réponse. SI vous pensez que votre réponse ajoute quelque chose d'important et de nouveau, merci de développer avec plus d'explication.
InformationsquelleAutor Sudhar P
0

Je ne suis pas un SQL expert afin de garder avec moi. Je suis sûr que vous obtiendrez une meilleure réponse assez vite. Voici comment vous pouvez trouver les enregistrements en double.
```
select t1.empid, t1.empssn, count(*)
from employee as t1 
inner join employee as t2 on (t1.empid=t2.empid and t1.empssn = t2.empssn)
group by t1.empid, t1.empssn
having count(*) > 1
```
La suppression d'entre eux seront plus délicat car il n'y a rien dans les données que vous pouvez utiliser dans une instruction delete pour différencier les doublons. Je soupçonne que la réponse va impliquer row_number() ou l'ajout d'une colonne d'identité.

InformationsquelleAutor Josh

créer des index cluster unique Employee_idx 
l'Employé ( EmpId,EmpSSN ) 
avec ignore_dup_key

Vous pouvez supprimer l'index si vous n'en avez pas besoin.

InformationsquelleAutor Sudhir

pas ID, pas de rowcount() ou pas temp table nécessaire....

WHILE 
  (
     SELECT  COUNT(*) 
     FROM TBLEMP  
     WHERE EMPNO 
            IN (SELECT empno  from tblemp group by empno having count(empno)>1)) > 1 


DELETE top(1)  
FROM TBLEMP 
WHERE EMPNO IN (SELECT empno  from tblemp group by empno having count(empno)>1)

InformationsquelleAutor Ashish Sahu

0

il y a deux colonnes dans le tableau ID et le nom de l'endroit où les noms sont en répétant avec différents Identifiants donc, pour que vous puissiez utiliser cette requête:
.
.
```
DELETE FROM dbo.tbl1
WHERE id NOT IN (
     Select MIN(Id) AS namecount FROM tbl1
     GROUP BY Name
)
```
InformationsquelleAutor user2497372
0

Avoir une table de base de données sans Clé Primaire est vraiment et de se dire très MAUVAISE PRATIQUE...donc une fois que vous ajoutez un (ALTER TABLE)

Exécuter jusqu'à ce que vous ne voyez pas plus dupliqué dossiers (c'est le but d'AVOIR le COMTE)
```
DELETE FROM [TABLE_NAME] WHERE [Id] IN 
(
    SELECT MAX([Id])
    FROM [TABLE_NAME]
    GROUP BY [TARGET_COLUMN]
    HAVING COUNT(*) > 1
)


SELECT MAX([Id]),[TABLE_NAME], COUNT(*) AS dupeCount
FROM [TABLE_NAME]
GROUP BY [TABLE_NAME]
HAVING COUNT(*) > 1
```
MAX([Id]) aura pour effet de supprimer les derniers dossiers (ceux ajoutés après le créé en premier) dans le cas où vous souhaitez le sens opposé que dans le cas d'exiger la suppression d'enregistrements d'abord et laisser le dernier enregistrement inséré veuillez utiliser MIN([Id])

InformationsquelleAutor d1jhoni1b

-1

select t1.* from employee t1, employee t2 where t1.empid=t2.empid and t1.empname = t2.empname and t1.salary = t2.salary
group by t1.empid, t1.empname,t1.salary having count(*) > 1

La question à laquelle répond-elle à?

InformationsquelleAutor

-2

DELETE FROM 'test' 
USING 'test' , 'test' as vtable
WHERE test.id>vtable.id and test.common_column=vtable.common_column

À l'aide de ce que nous pouvons supprimer les enregistrements en double

InformationsquelleAutor jayaram.pagoti

-3
```
MODIFIER IGNORER le test de la TABLE 
AJOUTER un INDEX UNIQUE 'test' ('b'); 
```
@ ici " b " est le nom de la colonne à l'unicité,
@ ici "test" est le nom de l'index.
- Pas distance valide la syntaxe SQL Server.
InformationsquelleAutor jayaram.pagoti

Vous devez vous connecter pour publier un commentaire.