Obtenir des n premiers enregistrements pour chaque groupe de résultats groupés

Suivantes est la plus simple possible exemple, bien que toute solution devrait être en mesure à l'échelle par le nombre n d'obtenir les meilleurs résultats sont nécessaires:

Donné un tableau comme celui ci-dessous, avec la personne, le groupe et l'âge des colonnes, comment voulez-vous obtenir les 2 plus anciens de personnes dans chaque groupe? (Les liens au sein de groupes ne doivent pas céder plus de résultats, mais de donner les 2 premiers dans l'ordre alphabétique)

+--------+-------+-----+ 
| Personne | Groupe | Âge | 
+--------+-------+-----+ 
| Bob| 1 | 32 | 
| Jill| 1 | 34 | 
| Shawn| 1 | 42 | 
| Jake| 2 | 29 | 
| Paul| 2 | 36 | 
| Laura| 2 | 39 | 
+--------+-------+-----+

Résultats souhaités:

+--------+-------+-----+ 
| Shawn| 1 | 42 | 
| Jill| 1 | 34 | 
| Laura| 2 | 39 | 
| Paul| 2 | 36 | 
+--------+-------+-----+

REMARQUE: Cette question s'appuie sur un précédent- Obtenir des enregistrements avec valeur maximale pour chaque groupe d'regroupés les résultats SQL - pour l'obtention d'une seule rangée du haut, de chaque groupe, et qui a reçu une grande spécifique à MySQL réponse de @Bohème:

select * 
from (select * from mytable order by `Group`, Age desc, Person) x
group by `Group`

Aimerais être en mesure de construire ce, bien que je ne vois pas comment.

stackoverflow.com/questions/11158917/get-n-per-group-mysql et stackoverflow.com/questions/2129693/... pourrait vous aider
Cochez cette exemple. Il est assez proche de ce que vous demandez: stackoverflow.com/questions/1537606/...

OriginalL'auteur Yarin | 2012-08-24

80

Ici est une façon de le faire, à l'aide de UNION ALL (Voir SQL jouer avec la Démo). Cela fonctionne avec les deux groupes, si vous avez plus de deux groupes, alors vous devez spécifier le group nombre et ajouter des requêtes pour chaque group:
```
(
  select *
  from mytable 
  where `group` = 1
  order by age desc
  LIMIT 2
)
UNION ALL
(
  select *
  from mytable 
  where `group` = 2
  order by age desc
  LIMIT 2
)
```
Il existe une variété de façons de le faire, voir cet article pour déterminer le meilleur itinéraire pour votre situation:

http://www.xaprb.com/blog/2006/12/07/how-to-select-the-firstleastmax-row-per-group-in-sql/

Edit:

Cela pourrait fonctionner pour vous aussi, il génère un numéro de ligne pour chaque enregistrement. À l'aide d'un exemple à partir du lien ci-dessus vous obtiendrez seulement les enregistrements avec un numéro de ligne est inférieure ou égale à 2:
```
select person, `group`, age
from 
(
   select person, `group`, age,
      (@num:=if(@group = `group`, @num +1, if(@group := `group`, 1, 1))) row_number 
  from test t
  CROSS JOIN (select @num:=0, @group:=null) c
  order by `Group`, Age desc, person
) as x 
where x.row_number <= 2;
```
Voir Démo

si il ont 1 000+ groupes, ne serait-ce pas rendre tout ceci un peu effrayant?
oui, il faudrait, et c'Est pourquoi j'ai dit que vous devez spécifier dans les deux groupes. Il serait devenu laid.
Je crois que j'ai trouvé une meilleure solution, voir mon edit
Une remarque pour tous ceux qui lisent ceci: La version est l'variables est proche d'être correcte. Toutefois, MySQL ne garantit pas l'ordre d'évaluation des expressions dans le SELECT (et, en fait, parfois, évalue les out-of-order). La clé de la solution est de mettre toutes les affectations de variables dans une expression unique; en voici un exemple: stackoverflow.com/questions/38535020/....
Mise à jour de ma réponse, merci pour le tuyau. Il a également pris beaucoup trop de temps pour me mettre à jour.

OriginalL'auteur Taryn
54

Dans d'autres bases de données que vous pouvez faire cela en utilisant ROW_NUMBER. MySQL ne supporte pas ROW_NUMBER mais vous pouvez utiliser des variables pour l'émuler:
```
SELECT
    person,
    groupname,
    age
FROM
(
    SELECT
        person,
        groupname,
        age,
        @rn := IF(@prev = groupname, @rn + 1, 1) AS rn,
        @prev := groupname
    FROM mytable
    JOIN (SELECT @prev := NULL, @rn := 0) AS vars
    ORDER BY groupname, age DESC, person
) AS T1
WHERE rn <= 2
```
Voir en ligne: sqlfiddle

Modifier je viens de remarquer que bluefeet posté un très semblables réponse: +1 pour lui. Cependant cette réponse a deux petits avantages:
1. Il est une seule requête. Les variables sont initialisées à l'intérieur de l'instruction SELECT.
2. Il gère les liens comme décrit dans la question (en ordre alphabétique par nom).
Donc je vais le laisser ici au cas où ça pourrait aider quelqu'un.

Marque - C'est bien pour nous. Merci de me donner une autre bonne alternative pour le compliment @bluefeet - beaucoup apprécié.
Pourquoi est-ce que cette Requête a fonctionné? pastebin.com/u17NRM8B
+1. Cela a fonctionné pour moi. Vraiment propre et au point de réponse. Pouvez-vous nous expliquer comment cela fonctionne? Ce qui est la logique derrière cela?
Solution sympa mais il semble que cela ne fonctionne pas dans mon environnement (MySQL 5.6) parce que la clause order by est appliquée après le sélectionner afin de ne pas retourner le résultat haut de la page, voir mon autre solution pour résoudre ce problème
Cela fonctionne très bien pour moi dans MySQL 5.7, mais ce serait génial si quelqu'un pouvait expliquer comment cela fonctionne

OriginalL'auteur Mark Byers
34

Essayez ceci:
```
SELECT a.person, a.group, a.age FROM person AS a WHERE 
(SELECT COUNT(*) FROM person AS b 
WHERE b.group = a.group AND b.age >= a.age) <= 2 
ORDER BY a.group ASC, a.age DESC
```
DÉMO

snuffin qui sortent de nulle part avec la solution la plus simple! Est-ce plus élégant que Ludo/projet de Loi Karwin? Puis-je obtenir de commentaire
Hm, pas sûr si c'est plus élégant. Mais à en juger par la voix, je suppose que bluefeet pourrait avoir la meilleure solution.
Il y a un problème avec cela. Si il y a égalité pour la deuxième place dans le groupe, un seul top résultat est retourné. Voir modifié démo
Ce n'est pas un problème si c'est souhaité. Vous pouvez définir l'ordre de a.person.
non, il n'est pas de travail dans mon cas, ni la DÉMO de travail

OriginalL'auteur snuffn

Comment sur l'utilisation de l'auto-assemblage:

CREATE TABLE mytable (person, groupname, age);
INSERT INTO mytable VALUES('Bob',1,32);
INSERT INTO mytable VALUES('Jill',1,34);
INSERT INTO mytable VALUES('Shawn',1,42);
INSERT INTO mytable VALUES('Jake',2,29);
INSERT INTO mytable VALUES('Paul',2,36);
INSERT INTO mytable VALUES('Laura',2,39);

SELECT a.* FROM mytable AS a
  LEFT JOIN mytable AS a2 
    ON a.groupname = a2.groupname AND a.age <= a2.age
GROUP BY a.person
HAVING COUNT(*) <= 2
ORDER BY a.groupname, a.age DESC;

me donne:

a.person    a.groupname  a.age     
----------  -----------  ----------
Shawn       1            42        
Jill        1            34        
Laura       2            39        
Paul        2            36

J'ai été fortement inspiré par la réponse de Bill Karwin à Select top 10 des dossiers pour chaque catégorie

Aussi, je suis en utilisant SQLite, mais cela doit fonctionner sur MySQL.

Une autre chose: dans le ci-dessus, j'ai remplacé le group colonne avec un groupname colonne pour plus de commodité.

Modifier:

Suivi des OP de commentaire concernant l'absence de cravate résultats, j'ai incrémenté sur snuffin de réponse pour afficher tous les liens. Cela signifie que si les derniers sont des liens, plus de 2 lignes peuvent être retournés, comme indiqué ci-dessous:

.headers on
.mode column

CREATE TABLE foo (person, groupname, age);
INSERT INTO foo VALUES('Paul',2,36);
INSERT INTO foo VALUES('Laura',2,39);
INSERT INTO foo VALUES('Joe',2,36);
INSERT INTO foo VALUES('Bob',1,32);
INSERT INTO foo VALUES('Jill',1,34);
INSERT INTO foo VALUES('Shawn',1,42);
INSERT INTO foo VALUES('Jake',2,29);
INSERT INTO foo VALUES('James',2,15);
INSERT INTO foo VALUES('Fred',1,12);
INSERT INTO foo VALUES('Chuck',3,112);


SELECT a.person, a.groupname, a.age 
FROM foo AS a 
WHERE a.age >= (SELECT MIN(b.age)
                FROM foo AS b 
                WHERE (SELECT COUNT(*)
                       FROM foo AS c
                       WHERE c.groupname = b.groupname AND c.age >= b.age) <= 2
                GROUP BY b.groupname)
ORDER BY a.groupname ASC, a.age DESC;

me donne:

person      groupname   age       
----------  ----------  ----------
Shawn       1           42        
Jill        1           34        
Laura       2           39        
Paul        2           36        
Joe         2           36        
Chuck       3           112

Juste vu que réponse de Bill Karwin - merci pour l'appliquer ici
Que pensez-vous de Snuffin de réponse? Je suis en train de comparer les deux
Il y a un problème avec cela. Si il y a égalité pour la deuxième place dans le groupe, un seul top résultat est retourné Voir démo
l'exigence de départ était que chaque groupe de restituer les n résultats, avec tous les liens résolus par ordre alphabétique
Le modifier pour inclure les liens ne fonctionne pas pour moi. Je reçois ERROR 1242 (21000): Subquery returns more than 1 row, sans doute à cause de la GROUP BY. Quand j'execute le SELECT MIN sous-requête seul, il génère trois lignes: 34, 39, 112 et là, il semble que la deuxième valeur doit être 36, pas 39.

OriginalL'auteur

Check this out:

SELECT
  p.Person,
  p.`Group`,
  p.Age
FROM
  people p
  INNER JOIN
  (
    SELECT MAX(Age) AS Age, `Group` FROM people GROUP BY `Group`
    UNION
    SELECT MAX(p3.Age) AS Age, p3.`Group` FROM people p3 INNER JOIN (SELECT MAX(Age) AS Age, `Group` FROM people GROUP BY `Group`) p4 ON p3.Age < p4.Age AND p3.`Group` = p4.`Group` GROUP BY `Group`
  ) p2 ON p.Age = p2.Age AND p.`Group` = p2.`Group`
ORDER BY
  `Group`,
  Age DESC,
  Person;

SQL Violon: http://sqlfiddle.com/#!2/cdbb6/15

L'homme, d'autres ont trouvé beaucoup plus simple des solutions...je viens de passer 15 minutes sur ce et a été très fier de moi-même pour venir à de telles solutions compliquées, trop. Qui suce.
de votre tête jusqu'à Travesty3 - upvoted votre effort, merci
J'ai dû trouver un numéro de version interne qui est 1 de moins que l'actuel cela m'a donné la réponse pour ce faire: max(internal_version - 1) - donc moins de stress 🙂

OriginalL'auteur Travesty3

8

Snuffin solution semble assez lent à exécuter lorsque vous avez beaucoup de lignes et de Marque Byers/Rick James et Bluefeet solutions ne fonctionne pas sur mon environnement (MySQL 5.6), car l'ordre est appliqué après l'exécution de sélectionner, voici donc une variante de Marc Byers/Rick James solutions pour résoudre ce problème (avec un supplément de imbriquées à choisir):
```
select person, groupname, age
from
(
    select person, groupname, age,
    (@rn:=if(@prev = groupname, @rn +1, 1)) as rownumb,
    @prev:= groupname 
    from 
    (
        select person, groupname, age
        from persons 
        order by groupname ,  age desc, person
    )   as sortedlist
    JOIN (select @prev:=NULL, @rn :=0) as vars
) as groupedlist 
where rownumb<=2
order by groupname ,  age desc, person;
```
J'ai essayé de requête similaire sur une table de 5 millions de lignes et il renvoie le résultat en moins de 3 secondes

C'est la seule requête qui a été de travailler dans mon environnement. Merci!
Ajouter LIMIT 9999999 à toute table dérivée avec un ORDER BY. Ce prévenir la ORDER BY d'être ignoré.
J'ai couru une requête similaire sur une table contenant quelques milliers de lignes, et il a fallu 60 secondes pour retourner un résultat, donc... merci pour le post, c'est un début pour moi. (ETA: jusqu'à 5 secondes. Bon!!!)

OriginalL'auteur Laurent PELE

Si les autres réponses ne sont pas assez rapides Donner ce code un essai:

SELECT
        province, n, city, population
    FROM
      ( SELECT  @prev := '', @n := 0 ) init
    JOIN
      ( SELECT  @n := if(province != @prev, 1, @n + 1) AS n,
                @prev := province,
                province, city, population
            FROM  Canada
            ORDER BY
                province   ASC,
                population DESC
      ) x
    WHERE  n <= 3
    ORDER BY  province, n;

De sortie:

+---------------------------+------+------------------+------------+
| province                  | n    | city             | population |
+---------------------------+------+------------------+------------+
| Alberta                   |    1 | Calgary          |     968475 |
| Alberta                   |    2 | Edmonton         |     822319 |
| Alberta                   |    3 | Red Deer         |      73595 |
| British Columbia          |    1 | Vancouver        |    1837970 |
| British Columbia          |    2 | Victoria         |     289625 |
| British Columbia          |    3 | Abbotsford       |     151685 |
| Manitoba                  |    1 | ...

Regardé votre site - où puis-je obtenir la source de données pour les villes de populations? TIA et de rgs.
maxmind.com/en/worldcities -- je le trouve pratique pour expérimenter avec lat/lng recherches, de requêtes, de partitionnement, etc. Il est assez grand pour être intéressant, mais lisible assez pour comprendre les réponses. Les Canadiens sous-ensemble est très pratique pour ce genre de question. (Moins de provinces, de villes des états-unis.)

OriginalL'auteur Rick James

2

Je voulais partager cela car j'ai passé un long moment à la recherche d'un moyen facile de l'appliquer dans un programme java, je travaille sur. Ce n'est pas tout à fait donner la sortie que vous recherchez, mais ses proches. La fonction mysql appelée GROUP_CONCAT() a vraiment bien travaillé pour spécifier le nombre de résultats à retourner dans chaque groupe. À l'aide de LIMIT ou de toute autre fantaisie de façons d'essayer de le faire avec COUNT ne fonctionne pas pour moi. Donc, si vous êtes prêt à accepter une modification de la sortie, c'est une excellente solution. Disons que j'ai une table appelée "étudiant" avec id d'étudiants, de leur sexe, et de la gpa. Disons que je veux le top 5 gpas pour chacun des sexes. Ensuite, je peux écrire la requête de ce
```
SELECT sex, SUBSTRING_INDEX(GROUP_CONCAT(cast(gpa AS char ) ORDER BY gpa desc), ',',5) 
AS subcategories FROM student GROUP BY sex;
```
Notez que le paramètre "5", dit-il combien d'entrées pour concaténer dans chaque ligne

Et la sortie devrait ressembler à quelque chose comme
```
+--------+----------------+
| Male   | 4,4,4,4,3.9    |
| Female | 4,4,3.9,3.9,3.8|
+--------+----------------+
```
Vous pouvez également modifier la ORDER BY variable et de leur ordonner d'une manière différente. Donc, si j'avais l'âge de l'étudiant je pouvais remplacer la "gpa desc' avec 'âge desc' et ça marche! Vous pouvez également ajouter des variables à l'instruction group by pour obtenir plus de colonnes dans le résultat. Donc, c'est juste un moyen que j'ai trouvé qui est assez flexible et fonctionne bien si vous êtes ok avec juste la liste des résultats.

OriginalL'auteur Jon Bown
0

Dans SQL Server row_numer() est une fonction puissante qui peut entraîner facilement comme ci-dessous
```
select Person,[group],age
from
(
select * ,row_number() over(partition by [group] order by age desc) rn
from mytable
) t
where rn <= 2
```
Avec 8.0 et 10.2 être GA, cette réponse est la plus raisonnable.
que signifie " être GA? Les fonctions de la fenêtre (dev.mysql.com/doc/refman/8.0/en/window-functions.html) a résolu mon problème très bien.
signifie "généralisé". Il est tech-parler", "prêt pour le prime time", ou "libéré". Ils sont à travers le développement de la version et mettra l'accent sur les bug qu'ils ont manqué. Ce lien explique MySQL 8.0 de la mise en œuvre, qui peut être différent de MariaDB 10.2 mise en œuvre.

OriginalL'auteur Prakash
-1

Il y a vraiment une belle réponse à ce problème à MySQL - Comment Obtenir les N premières Lignes par Chaque Groupe

Basé sur la solution dans le lien référencé, votre requête serait comme:
```
SELECT Person, Group, Age
   FROM
     (SELECT Person, Group, Age, 
                  @group_rank := IF(@group = Group, @group_rank + 1, 1) AS group_rank,
                  @current_group := Group 
       FROM `your_table`
       ORDER BY Group, Age DESC
     ) ranked
   WHERE group_rank <= `n`
   ORDER BY Group, Age DESC;
```
où n est le top n et your_table est le nom de votre table.

Je pense que l'explication de la référence est vraiment clair. Pour une référence rapide, je vais le copier et le coller ici:

Actuellement MySQL ne prend pas en charge la fonction ROW_NUMBER() qui peut affecter
un numéro de séquence au sein d'un groupe, mais comme une solution de contournement, nous pouvons utiliser MySQL
les variables de session.

Ces variables ne nécessitent pas de déclaration, et peut être utilisé dans une requête
pour effectuer des calculs et pour stocker les résultats intermédiaires.

@current_country := pays de Ce code est exécuté pour chaque ligne et
stocke la valeur de la colonne à @current_country variable.

@country_rank := SI(@current_country = pays, @country_rank + 1, 1)
Dans ce code, si @current_country est la même que nous incrément de rang,
sinon mis à 1. Pour la première ligne @current_country est NULLE, de sorte
rang est également mis à 1.

Pour corriger classement, nous avons besoin d'ORDRE PAR pays, de la population DESC

Eh bien, c'est le principe utilisé par des solutions de Marc Byers, Rick James et la mienne.
Difficile de dire quel poste (Débordement de Pile ou SQLlines) a été le premier
Le mien a été posté le Fév, 2015. Je ne vois pas d'horodatage ou de nom sur SQLlines. MySQL blogs ont été autour assez longtemps pour certains d'entre eux sont hors de date, et doit être supprimé -- les gens sont en citant la mauvaise information.

OriginalL'auteur swdon

Vous devez vous connecter pour publier un commentaire.