SQL/mysql - Select distinct/UNIQUES, mais le retour de toutes les colonnes?

SELECT DISTINCT field1, field2, field3, ......   FROM table

Je suis en train d'accomplir l'instruction sql suivante, mais je veux retourner toutes les colonnes est-ce possible? Quelque chose comme:

SELECT DISTINCT field1, * from table

Pourquoi ne pas SELECT DISTINCT * FROM table ne fonctionne pas pour vous?
Si votre table a un PK toutes les lignes doivent être distinct par définition. Si vous essayez de sélectionner DISTINCT field1, mais en quelque sorte de retour de toutes les autres colonnes de ce qui doit arriver pour les colonnes qui ont plus d'une valeur pour un particulier field1 valeur? Vous devez utiliser GROUP BY et une sorte d'agrégation sur les autres colonnes par exemple.
Si vous voulez lignes répétées et non seulement des lignes distinctes, retirez la clé distinctes mot.
Pourriez-vous nous donner un exemple de ce que vous attendez les résultats ressembler? Jusqu'à présent, je ne peux pas faire tout le sens de votre requête souhaitée.
Je veux seulement le champ de 1 un de l'autre, DISTINCT * ne fonctionne pas
Ici est la réponse à la même question posée, vous devez d'abord obtenir la colonne distincte, avec leur id et ensuite joindre à la table d'origine. SELECT DISTINCT sur une colonne, retourner plusieurs autres colonnes
Qui sgbd que vous utilisez? Multiples et contradictoires/confus réponses ci-dessous. (Réponses aux questions tagged avec SQL doivent utiliser la norme ISO/IEC standard SQL.)

InformationsquelleAutor aryaxt | 2011-05-25

373

Vous êtes à la recherche d'un groupe par:
```
select *
from table
group by field1
```
Qui peut parfois être écrit avec un distinct sur l'énoncé:
```
select distinct on field1 *
from table
```
Sur la plupart des plates-formes, cependant, ni de la ci-dessus fonctionne, parce que le comportement sur les autres colonnes est pas spécifié. (Le premier fonctionne avec MySQL, si c'est ce que vous utilisez.)

Vous pouvez récupérer les différents champs et le bâton de choisir un seul arbitraire de ligne à chaque fois.

Sur certaines plates-formes (par exemple, PostgreSQL, Oracle, T-SQL), ce qui peut être fait directement à l'aide de fonctions de la fenêtre:
```
select *
from (
   select *,
          row_number() over (partition by field1 order by field2) as row_number
   from table
   ) as rows
where row_number = 1
```
Sur les autres (MySQL, SQLite), vous aurez besoin d'écrire les sous-requêtes qui fera de vous joindre à l'ensemble de la table avec elle-même (exemple), donc pas recommandée.
- Je crois que vous avez oublié un alias row_number() over (partition by field1) row_number
- La requête ne sera pas analyser pour moi et me donne une erreur: The ranking function "row_number" must have an ORDER BY clause. Nous devons ajouter la clause order by, après la partition par champ1. Donc la bonne requête sera select * from ( select *, row_number() over (partition by field1 order by orderbyFieldName) as row_number from table ) as rows where row_number = 1
- Merci! J'ai été dans le même problème et la solution a été la GROUP BY
- Également dans Oracle (Oracle SQL Developer) vous ne pouvez pas spécifier select *, row_number() over (partition by field1 order by field2) as row_number from table. Vous devez utiliser de manière explicite le nom de la table/alias dans la requête select select **table**.*, row_number() over (partition by field1 order by field2) as row_number from table
- "les Réponses aux questions tagged avec SQL doivent utiliser la norme ISO/IEC standard SQL."
- Peut-être ... aujourd'hui. Comme vous pouvez le remarquer, cette réponse est presque 7 ans, à un point dans le temps où ce n'était pas le cas dans la mesure où je me souviens de l'époque où j'étais actif. Vous êtes les bienvenus pour modifier le balisage et/ou de modifier la réponse si vous le jugez nécessaire.
- select distinct on field1 * from table; Cela ne semble pas être la syntaxe correcte pour mysql - au moins pas de plus.
- select distinct on (field1) * from table; fonctionne également dans PostgreSQL
InformationsquelleAutor Denis de Bernardy
55

À partir de la formulation de votre question, je comprends que vous souhaitez sélectionner les valeurs distinctes pour un champ donné, et pour chaque valeur de disposer de toutes les autres valeurs de la colonne dans la même ligne. La plupart des Sgbd ne permettra pas cela avec ni DISTINCT ni GROUP BY, parce que le résultat n'est pas déterminé.

Pensez-y comme ça: si votre field1 se produit plus d'une fois, quelle est la valeur de field2 seront répertoriés (étant donné que vous avez la même valeur pour field1 en deux lignes, mais deux valeurs distinctes de field2 dans ces deux lignes).

Toutefois, vous pouvez utiliser les fonctions d'agrégation (explicitement pour chaque champ que vous souhaitez être indiqué) et à l'aide d'un GROUP BY au lieu de DISTINCT:
```
SELECT field1, MAX(field2), COUNT(field3), SUM(field4), .... FROM table GROUP BY field1
```
- +1 pour cette solution. Donc, nous pouvons faire SELECT field1, MIN(field2), MIN(field3), MIN(field4), .... FROM table GROUP BY field1, et champ2, 3, 4,,, ne sont pas tenus d'être des entiers (ou d'autres caractères), ils peuvent être de type char champs
- Fonctionnait bien jusqu'à ce que je me suis coincé à un booléen colonne. MIN(Dynamique) des valeurs de la colonne sont modifiés à false, même si c'était vrai.. de Toute autre fonction d'agrégation disponibles à l'adresse boolean – signonsridhar 6 minutes ago. Somme(dynamique) changé faux à 1
- Très bonne suggestion, m'a conduit à ma solution qui je pense est plus universelle -- prendre un coup d'oeil!
- lancez votre boolean int et l'utilisation de la somme; par exemple, sum(cast(COL as int)) > 0
InformationsquelleAutor Costi Ciudatu
20

Si j'ai bien compris votre problème correctement, il est semblable à l'une j'ai juste eu. Vous voulez être en mesure de limiter l'utilisation de DISTINCT d'un champ spécifié, plutôt que de l'appliquer à toutes les données.

Si vous utiliser GROUP BY sans une fonction d'agrégation, qui jamais terrain vous GROUPE PAR sera votre DISTINCTES déposées.

Si vous faites votre recherche:
```
SELECT * from table GROUP BY field1;
```
Il affichera tous vos résultats sur la base d'une seule instance de champ1.

Par exemple, si vous avez une table avec le nom, l'adresse et la ville. Une seule personne a plusieurs adresses enregistrées, mais vous voulez juste une adresse unique pour la personne, vous pouvez requête comme suit:
```
SELECT * FROM persons GROUP BY name;
```
Le résultat sera qu'une seule instance de ce nom apparaîtra avec son adresse, et l'autre sera omis dans le tableau résultant. Attention: si votre champs ont des valeurs atomiques telles que firstName, lastName vous voulez grouper par deux.
```
SELECT * FROM persons GROUP BY lastName, firstName;
```
parce que si deux personnes ont le même nom de famille et vous seul groupe par le nom de famille, l'une de ces personnes sera omis dans les résultats. Vous devez garder ces choses en considération. Espérons que cette aide.
- Comme mentionné dans la accepté de répondre, à travailler pour la plupart des incarnations de SQL -- uniquement pour MYSQL
InformationsquelleAutor rocklandcitizen
12
```
SELECT  c2.field1 ,
        field2
FROM    (SELECT DISTINCT
                field1
         FROM   dbo.TABLE AS C
        ) AS c1
        JOIN dbo.TABLE AS c2 ON c1.field1 = c2.field1
```
- Pourquoi il n'y a C alias quand il peut fonctionner sans elle? en ligne FROM dbo.TABLE AS C
- Je crois que c'est à cause de mon utilisation de RedGate SQLPrompt. La façon dont je l'ai configuré, il ajoute toujours des alias - même si nécessaire. Il est là "au cas où"
InformationsquelleAutor Stormy
7

C'est vraiment une bonne question. J'ai lu quelques réponses utiles ici déjà, mais sans doute, je peux ajouter une explication plus précise.

Réduire le nombre de résultats d'une requête avec une instruction GROUP BY est facile aussi longtemps que vous n'avez pas de requête d'informations supplémentaires. Supposons que vous avez obtenu le tableau suivant "lieux".
```
--country-- --city--
 France      Lyon
 Poland      Krakow
 France      Paris
 France      Marseille
 Italy       Milano
```
Maintenant la requête
```
SELECT country FROM locations
GROUP BY country
```
permettra:
```
--country--
 France
 Poland
 Italy
```
Toutefois, la requête suivante
```
SELECT country, city FROM locations
GROUP BY country
```
...déclenche une erreur dans MS SQL, car comment votre ordinateur savoir lequel des trois villes françaises "Lyon", "Paris" ou "Marseille" que vous souhaitez lire dans le champ à droite de "la France"?

Afin de corriger la deuxième requête, vous devez ajouter cette information. Une façon de le faire est d'utiliser la fonction MAX() et MIN(), la sélection de la plus grande ou la plus petite valeur parmi tous les candidats. MAX() et MIN() ne sont pas seulement applicable à des valeurs numériques, mais aussi de comparer l'ordre alphabétique de la chaîne de valeurs.
```
SELECT country, MAX(city) FROM locations
GROUP BY country
```
permettra:
```
--country-- --city--
 France      Paris
 Poland      Krakow
 Italy       Milano
```
ou:
```
SELECT country, MIN(city) FROM locations
GROUP BY country
```
permettra:
```
--country-- --city--
 France      Lyon
 Poland      Krakow
 Italy       Milano
```
Ces fonctions sont une bonne solution aussi longtemps que vous êtes bien avec la sélection de votre valeur à partir des deux extrémités de l'ordre alphabétique (ou numérique) de commande. Mais que faire si ce n'est pas le cas? Supposons que vous avez besoin d'une valeur avec une certaine caractéristique, par exemple en commençant avec la lettre "M". Maintenant, les choses se compliquent.

La seule solution que j'ai pu trouver jusqu'à présent est de mettre l'ensemble de votre requête dans une sous-requête, la construction de la colonne supplémentaire à l'extérieur d'elle par des mains:
```
SELECT
     countrylist.*,
     (SELECT TOP 1 city
     FROM locations
     WHERE
          country = countrylist.country
          AND city like 'M%'
     )
FROM
(SELECT country FROM locations
GROUP BY country) countrylist
```
permettra:
```
--country-- --city--
 France      Marseille
 Poland      NULL
 Italy       Milano
```
InformationsquelleAutor Ulf Sanne
3

Grande question @aryaxt -- vous pouvez dire que c'était une excellente question, parce que vous l'a demandé il y a 5 ans et je suis tombé sur ça aujourd'hui en essayant de trouver la réponse!

J'ai juste essayé de modifier la accepté de répondre à inclure, mais dans le cas de mon édition ne pas se rendre dans:

Si votre table n'était pas grande, et en supposant que votre clé primaire est une auto-incrémentation entier, vous pourriez faire quelque chose comme ceci:
```
SELECT 
  table.*
FROM table
--be able to take out dupes later
LEFT JOIN (
  SELECT field, MAX(id) as id
  FROM table
  GROUP BY field
) as noDupes on noDupes.id = table.id
WHERE
  //this will result in only the last instance being seen
  noDupes.id is not NULL
```
- WHERE noDupes is not NULL - pas de colonne spécifié pour la table noDupes, est-ce correct?
- bonne prise, juste édité
InformationsquelleAutor Garrett Simpson
2

Vous pouvez le faire avec un WITH clause.

Par exemple:
```
WITH c AS (SELECT DISTINCT a, b, c FROM tableName)
SELECT * FROM tableName r, c WHERE c.rowid=r.rowid AND c.a=r.a AND c.b=r.b AND c.c=r.c
```
Cela vous permet également de sélectionner uniquement les lignes sélectionnées dans la WITH clauses de la requête.

InformationsquelleAutor user2225399

Pour SQL Server, vous pouvez utiliser le dense_rank supplémentaires et de fonctions de fenêtrage pour obtenir toutes les lignes ET colonnes avec des valeurs dupliquées sur les colonnes spécifiées. Voici un exemple...

with t as (
    select col1 = 'a', col2 = 'b', col3 = 'c', other = 'r1' union all
    select col1 = 'c', col2 = 'b', col3 = 'a', other = 'r2' union all
    select col1 = 'a', col2 = 'b', col3 = 'c', other = 'r3' union all
    select col1 = 'a', col2 = 'b', col3 = 'c', other = 'r4' union all
    select col1 = 'c', col2 = 'b', col3 = 'a', other = 'r5' union all
    select col1 = 'a', col2 = 'a', col3 = 'a', other = 'r6'
), tdr as (
    select 
        *, 
        total_dr_rows = count(*) over(partition by dr)
    from (
        select 
            *, 
            dr = dense_rank() over(order by col1, col2, col3),
            dr_rn = row_number() over(partition by col1, col2, col3 order by other)
        from 
            t
    ) x
)

select * from tdr where total_dr_rows > 1

C'est de prendre un nombre de lignes pour chaque combinaison distincte de col1, col2 et col3.

trop compliqué et trop spécifique pour une mise en œuvre de SQL

InformationsquelleAutor dotjoe

Essayer

SELECT table.* FROM table 
WHERE otherField = 'otherValue'
GROUP BY table.fieldWantedToBeDistinct
limit x

InformationsquelleAutor Pedro Ramos

0
```
SELECT *
FROM tblname
GROUP BY duplicate_values
ORDER BY ex.VISITED_ON DESC
LIMIT 0 , 30
```
dans ORDER BY je viens de mettre exemple ici, vous pouvez également ajouter un champ ID dans ce
- Comme mentionné dans la accepté de répondre, à travailler pour la plupart des incarnations de SQL -- uniquement pour MYSQL
InformationsquelleAutor SagarPPanchal
-1

Ajouter un GROUPE PAR champ dont vous voulez vérifier les doublons
votre requête peut ressembler à
```
SELECT field1, field2, field3, ......   FROM table GROUP BY field1
```
champ1 sera vérifiée à exclure les enregistrements en double

ou vous pouvez interroger comme
```
SELECT *  FROM table GROUP BY field1
```
doublons de champ1 sont exclus de SÉLECTIONNER
- Clause GROUP BY doit correspondre à des champs sélectionnés. reste qu'il va jeter erreur comme filed2 must appear in the GROUP BY clause or be used in an aggregate function
InformationsquelleAutor iCodeCrew
-2

Intégrer l'ensemble de vos champs dans la clause GROUP BY.
- Peut-être fournir un exemple de code de ce que tu veux dire?
- Pour faire une bonne réponse, vous devez inclure un peu plus de détails sur ce que tu veux dire.
InformationsquelleAutor wayneh
-2

Il peut être fait par requête interne
```
$query = "SELECT * 
            FROM (SELECT field
                FROM table
                ORDER BY id DESC) as rows               
            GROUP BY field";
```
- Cela ne répond pas à la question, l'OP a été d'essayer d'obtenir toutes les données de la table, mais supprimer les lignes contenant des doublons d'un seul champ
InformationsquelleAutor Zaheer Babar
-3
```
SELECT * from table where field in (SELECT distinct field from table)
```
- Qui ne sera pas faire le travail. Vous avez sélectionné la colonne distincte dans la sous-requête, mais la clause where obtient toutes les colonnes avec cette valeur. Si la requête est aussi bon que l'écriture "select * from table" à moins que "champ" de la colonne est une colonne unique, auquel cas l'distinctes sur cette colonne n'est pas nécessaire à tous.
InformationsquelleAutor Andrew
-3

SELECT DISTINCT CHAMP1, CHAMP2, CHAMP3 from TABLE1 fonctionne si les valeurs de tous les trois colonnes sont uniques dans la table.

Si, par exemple, vous avez plusieurs valeurs identiques pour le prénom, mais le nom de famille et d'autres informations dans les colonnes sélectionnées est différent, l'enregistrement sera inclus dans le jeu de résultats.
- Cela ne répond pas à la question, l'OP a été d'essayer d'obtenir toutes les données de la table, mais supprimer les lignes contenant des doublons d'un seul champ
InformationsquelleAutor Doris Gammenthaler
-3

Je conseille
```
SELECT  * from table where field1 in 
(
  select distinct field1 from table
)
```
de cette façon, si vous avez la même valeur dans champ1 sur plusieurs lignes, tous les dossiers seront retournés.
- Il n'est pas différent avec SELECT * FROM table;. Encore plus, Il est lent.
- S'il vous plaît, essayez de votre première réponse.
InformationsquelleAutor Ioannis K

Vous devez vous connecter pour publier un commentaire.