Utilisation d'une clause DISTINCT pour filtrer les données mais toujours extraire d'autres champs qui ne sont pas DISTINCT

Je suis en train d'écrire une requête dans Postgresql qui tire un ensemble de données classées et des filtres par un champ distinct. J'ai aussi besoin de tirer plusieurs autres champs de la même table de la ligne, mais ils doivent être en reste de la distinct de l'évaluation. exemple:

  SELECT DISTINCT(user_id) user_id, 
         created_at 
    FROM creations 
ORDER BY created_at   
   LIMIT 20

J'ai besoin de la user_id être DISTINCTmais ne se soucient pas si la created_at date est unique ou pas. Parce que le created_at date est incluse dans l'évaluation, je suis en double user_id dans mon jeu de résultats.

Aussi, les données doivent être commandés par la date, l'utilisation d'un DISTINCT ON n'est pas une option ici. - Il nécessaire que la DISTINCT ON champ soyez le premier champ dans la ORDER BY clause et qui ne livre pas les résultats que je cherche.

Comment puis-je utiliser correctement le DISTINCT clause, mais limite sa portée aux seuls un champ encore en sélectionnant d'autres domaines?

source d'informationauteur mindtonic

5

Comme vous l'avez découvert, standard SQL traite DISTINCT comme s'appliquant à l'ensemble de la liste de sélection, ne pas simplement une colonne ou un peu de colonnes. La raison pour cela est qu'il est ambigu de la valeur à mettre dans les colonnes de vous exclure de la DISTINCT. Pour la même raison, le standard SQL ne permet pas d'avoir ambigu colonnes dans une requête avec GROUP BY.

Mais PostgreSQL dispose d'une extension non standard de SQL pour permettre ce que vous demandez: DISTINCT ON (expr).
```
SELECT DISTINCT ON (user_id) user_id, created_at 
FROM creations 
ORDER BY user_id, created_at   
LIMIT 20
```
Vous devez inclure l'expression distincte(s) que la partie gauche de votre clause ORDER BY.

Voir le manuel sur La Clause DISTINCT pour plus d'informations.
3

La GROUP BY devrait s'assurer différentes valeurs des colonnes groupées, cela pourrait vous donner ce que vous êtes après.

(Note que je vais mettre dans mes 2 cents, même si je ne suis pas familier avec PostgreSQL, mais plutôt de MySQL et Oracle)

Dans MySql
```
SELECT user_id, created_at
FROM creations
GROUP BY user_id
ORDER BY user_id
```
Dans Oracle sqlplus
```
SELECT user_id, FIRST(created_at)
FROM creations
GROUP BY user_id
ORDER BY user_id
```
Ils vous donneront l' user_id suivie par la première created_at associés à ce user_id. Si vous souhaitez une autre created_at vous avez la possibilité de remplacer d'ABORD avec d'autres fonctions comme le AVGMINMAXou LAST dans Oracle, vous pouvez aussi essayer d'ajouter ORDER BY sur les autres colonnes (y compris ceux qui ne sont pas retournés, pour vous donner un autre created_at.
3

Votre question n'est pas bien défini - quand vous dites que vous avez besoin également d'autres données de la même rangée que vous n'êtes pas définir de qui ligne.

Vous faire dire que vous devez trier les résultats par created_atdonc je vais assumer que vous souhaitez que les valeurs de la ligne avec min created_at (la plus ancienne).

Cela devient maintenant l'un des plus commun de sorte que SQL questions - récupération des lignes contenant une certaine valeur totale (MIN, MAX).

Par exemple
```
SELECT user_id, MIN(created_at) AS created_at
FROM creations
GROUP BY user_id
ORDER BY MIN(create_at)
LIMIT 20
```
Cette approche ne vous laissera pas (facilement) prendre d'autres valeurs de la même ligne.

Une approche qui vous permettra de choisir d'autres valeurs est
```
SELECT c.user_id, c.created_at, c.other_columns
FROM creations c LEFT JOIN creation c_help
     ON c.user_id = c_help.user_id AND c.created_at > c_help.create_at
WHERE c_help IS NULL
ORDER BY c.created_at
LIMIT 20
```
3

Si vous voulez le plus récent created_at pour chaque utilisateur, puis-je vous suggérer d'agrégation comme ceci:
```
SELECT user_id, MAX(created_at)
FROM creations
WHERE ....
GROUP BY user_id
ORDER BY created_at DESC
```
Ce sera le retour de la plus récente created_at pour chaque user_id
Si vous voulez seulement le top 20, puis ajouter
```
LIMIT 20
```
EDIT: C'est fondamentalement la même chose de la Déraison dit ci-dessus... de définir à partir de quelle ligne vous voulez que les données par agrégation.

En utilisant une sous-requête a été suggéré par quelqu'un sur irc #postgresql canal. Il a travaillé:

SELECT user_id  
FROM (SELECT DISTINCT ON (user_id) * FROM creations) ss  
ORDER BY created_at DESC  
LIMIT 20;

Vous devez vous connecter pour publier un commentaire.