SQL “select lorsqu'elle n'est pas sous-requête” ne retourne aucun résultat

Avertissement: j'ai compris le problème (je pense), mais je voulais ajouter ce sujet pour Stack Overflow car je ne pouvais pas (facilement) le trouver n'importe où. Aussi, quelqu'un pourrait avoir une meilleure réponse que moi.

J'ai une base de données où une table "Communes" est référencé par plusieurs autres tables. Je voulais voir ce que les enregistrements dans la table Commune étaient des orphelins (c'est à dire, n'avait pas de références de toutes les autres tables).

J'ai couru cette requête:

select *
from Common
where common_id not in (select common_id from Table1)
and common_id not in (select common_id from Table2)

Je sais qu'il existe des enregistrements orphelins, mais pas de dossiers ont été retournés. Pourquoi pas?

(C'est SQL Server, si il le faut.)

Cette stackoverflow.com/a/129152/1667619 les réponses à la question POURQUOI assez bien.

InformationsquelleAutor Jeremy Stein | 2009-09-10

210

Mise à jour:

Ces articles dans mon blog décrire les différences entre les méthodes en plus de détail:
Il y a trois façons de faire une telle requête:
- LEFT JOIN /IS NULL:
```
SELECT  *
FROM    common
LEFT JOIN
        table1 t1
ON      t1.common_id = common.common_id
WHERE   t1.common_id IS NULL
```
- NOT EXISTS:
```
SELECT  *
FROM    common
WHERE   NOT EXISTS
        (
        SELECT  NULL
        FROM    table1 t1
        WHERE   t1.common_id = common.common_id
        )
```
- NOT IN:
```
SELECT  *
FROM    common
WHERE   common_id NOT IN
        (
        SELECT  common_id
        FROM    table1 t1
        )
```
Quand table1.common_id n'est pas nullable, toutes ces requêtes sont sémantiquement identiques.

Quand il est nullable, NOT IN est différente, puisque IN (et, par conséquent, NOT IN) retour NULL lorsqu'une valeur ne correspond pas à quoi que ce soit dans une liste contenant un NULL.

Cela peut être déroutant, mais peut devenir plus évident si nous nous rappelons la syntaxe alternative à cela:
```
common_id = ANY
(
SELECT  common_id
FROM    table1 t1
)
```
Le résultat de cette condition est un booléen produit de toutes les comparaisons à l'intérieur de la liste. Bien sûr, un seul NULL valeur les rendements de la NULL résultat qui rend la totalité du résultat NULL trop.

Nous n'avons jamais ne peut pas dire certainement que common_id n'est pas égal à quoi que ce soit de cette liste, depuis au moins l'une des valeurs est NULL.

Supposons que nous disposons de ces données:
```
common

--
1
3

table1

--
NULL
1
2
```
LEFT JOIN /IS NULL et NOT EXISTS sera de retour 3, NOT IN sera de retour rien (car il sera toujours correspondre à la FALSE ou NULL).

Dans MySQL, en cas de non-colonne nullable, LEFT JOIN /IS NULL et NOT IN sont un peu (quelques pour cent) plus efficace que NOT EXISTS. Si la colonne est nullable, NOT EXISTS est le plus efficace (encore une fois, pas beaucoup).

Dans Oracle, tous les trois requêtes de rendement mêmes plans (un ANTI JOIN).

Dans SQL Server, NOT IN /NOT EXISTS sont plus efficaces, car LEFT JOIN /IS NULL ne peut pas être optimisé pour une ANTI JOIN par son optimiseur.

Dans PostgreSQL, LEFT JOIN /IS NULL et NOT EXISTS sont plus efficaces que les NOT IN, sinus, ils sont optimisés pour une Anti Join, tandis que NOT IN utilise hashed subplan (ou même un simple subplan si la sous-requête est trop grande pour le hachage)
- Super réponse! Merci!
- Grande explication!
- c'est génial et très utile
- Merci Quassnoi.
- +1 parce que, quatre ans et demi, cette réponse m'a aidé avec un problème qui m'avait perplexe!
- Clin d'oeil! Je pensais que je devenais fou avant que j'ai vu cette réponse
- Ce qui ne l' NOT EXISTS partie faire dans la deuxième solution? A quoi sert la SELECT NULL partie servir ?
- EXISTE renvoie la valeur TRUE si la requête à l'intérieur il retourne toutes les lignes. SELECT NULL pourrait ainsi être SELECT * ou SELECT 1 ou quoi que ce soit d'autre, le NOT EXISTS prédicat ne regarde pas les lignes de valeurs, ne compte qu'eux.
- Wow super! vraiment je vous remercie beaucoup. Vous m'avez sauvé!
InformationsquelleAutor Quassnoi
34

Si vous voulez que le monde d'être une valeur booléenne place, vous devez empêcher les nul (le tiers de la valeur) cas vous-même.

Ne pas écrire DANS les clauses qui autorise les valeurs null dans la liste de côté. Filtre à!
```
common_id not in
(
  select common_id from Table1
  where common_id is not null
)
```
- Vous avez mal compris la question - re-lire.
- les valeurs null dans la clause-liste sont souvent la cause d'un manque de résultats de requête.
- En fait, je pense que David B compris la question mieux que quiconque. Je voulais savoir POURQUOI aucun résultat n'a été renvoyé. Upvoted.
- Lors de la comparaison avec une valeur null, la réponse est inconnu " - à partir de la réponse par @Jeremy Stein. De common_id not in, nous pouvons encore avoir common_id valeur NULL. N'est pas le problème de n'avoir aucun résultats persistent ?
- href="https://stackoverflow.com/a/296158/8155">stackoverflow.com/a/296158/8155
InformationsquelleAutor Amy B
5

Table1 ou Table2 a des valeurs null pour common_id. Utilisez cette requête à la place:
```
select *
from Common
where common_id not in (select common_id from Table1 where common_id is not null)
and common_id not in (select common_id from Table2 where common_id is not null)
```
- Que faire si il y a des données dans une table, mais pas les autres? Voulez-vous "et" ou "ou" là-bas?
- Je suis à la recherche de documents ne sont pas mentionnées dans le tableau, donc, je veux ET. Je vais clarifier la question.
InformationsquelleAutor Jeremy Stein

select *
from Common c
where not exists (select t1.commonid from table1 t1 where t1.commonid = c.commonid)
and not exists (select t2.commonid from table2 t2 where t2.commonid = c.commonid)

+1 -- voir ma réponse à ce pourquoi.

InformationsquelleAutor patmortech

3
```
SELECT T.common_id
  FROM Common T
       LEFT JOIN Table1 T1 ON T.common_id = T1.common_id
       LEFT JOIN Table2 T2 ON T.common_id = T2.common_id
 WHERE T1.common_id IS NULL
   AND T2.common_id IS NULL
```
- Cette approche est pire que l'aide n'EXISTE PAS - la jointure des résultats en cherchant plus de lignes que nécessaire, puis les résultats sont comparés pour les colonnes null. Il fonctionne, mais la performance ne sera pas aussi bon - peut-être pire qu'avec l'aide DE sous-requêtes corrélées.
InformationsquelleAutor manji
3

Juste à côté de ma tête...
```
select c.commonID, t1.commonID, t2.commonID
from Common c
     left outer join Table1 t1 on t1.commonID = c.commonID
     left outer join Table2 t2 on t2.commonID = c.commonID
where t1.commonID is null 
     and t2.commonID is null
```
J'ai couru quelques tests et ici mes résultats.w.r.t. @patmortech la réponse de @rexem commentaires.

Si Table1 ou Table2 n'est pas indexée sur commonID, vous obtenez une analyse de la table, mais @patmortech de la requête est encore deux fois plus rapide (pour un 100K ligne de la table de maître).

Si ni sont indexés sur commonID, vous obtenez deux analyses de la table et la différence est négligeable.

Si les deux sont indexés sur commonID, le "n'existe pas" requête s'exécute dans 1/3 du temps.
- Cela devrait être une ET dans la clause where. Sinon, ça marche.
- modifié par votre commentaire. Le "ou" relever les orphelins dans le tableau.
- Voilà qui est mieux. Par ailleurs, est-il une raison que je doit utiliser les jointures externes plutôt que la sous-requête?
- La lisibilité est d'une primaire. Je soupçonne un meilleur plan d'exécution seraient générés, mais sans un plan de requête, je ne peux pas confirmer.
- Cette approche est pire que l'aide n'EXISTE PAS - la jointure des résultats en cherchant plus de lignes que nécessaire, puis les résultats sont comparés pour les colonnes null. Et n'EXISTE PAS est plus lisible pour le démarrage.
- vous ne pouvez pas faire cette demande sans un plan d'exécution.
- Pensez à ce que la requête a à faire pour produire les résultats. C'est OK à penser par vous-même plutôt que de se cacher derrière le plan d'exécution de la défense. Un plan d'exécution est seulement aussi bon que le modèle de données.
- vous avez fait valoir un point qui devrait maintenant être une réponse.
- Cela ne veut pas arrêter de pirater des réponses de ce type à partir de perpétuer eux-mêmes. Ne vous méprenez pas: - votre réponse œuvres, mais c'est dans le domaine de la mise Sélectionne dans la clause SELECT.
- point concédé. Mais vous pouvez ajouter de la valeur à la question en publiant un bien expliqué réponse.
- J'ai essayé les deux façons et, pour mes données, les sous-requêtes ont été de 5 à 10% plus rapide.
- Notez également que le top-rated réponse est exactement le même comme la mienne...
- J'ai ajouté mon commentaire à cette question aussi. Désolé si vous l'avez senti vous ont fait une cible.
- J'aimerais voir votre réponse expliqué sur quelque chose que je pourrais voter et de vous donner le crédit. J'ai utilisé @patmortech réponse et comparé avec le mien et il a entraîné dans pratiquement identique les plans de requête WRT coût. Les deux ont fait des analyses de tableaux de T1 & T2. Ma requête 51% du lot; de son de 49%.
- Apprécié, mais patmortech réponse était avant, j'ai trouvé la question.
- Il peut avoir été mais il n'explique pas pourquoi c'est mieux qu'une autre.
- pour la plupart des choses que j'ai fait en utilisant les jointures avec la clause where étaient plus rapides que les sous-requêtes. hausse les épaules.
InformationsquelleAutor Austin Salonen
3

Supposons que ces valeurs pour common_id:
```
Common - 1
Table1 - 2
Table2 - 3, null
```
Nous voulons la ligne dans la Commune de revenir, car il n'existe pas dans les autres tables. Toutefois, la valeur null jette dans un monkey wrench.

Avec ces valeurs, la requête est équivalente à:
```
select *
from Common
where 1 not in (2)
and 1 not in (3, null)
```
Qui est équivalent à:
```
select *
from Common
where not (1=2)
and not (1=3 or 1=null)
```
C'est là que le problème commence. Lors de la comparaison avec une valeur null, la réponse est inconnue. Ainsi la requête réduit à
```
select *
from Common
where not (false)
and not (false or unkown)
```
faux ou inconnu inconnu:
```
select *
from Common
where true
and not (unknown)
```
vrai et pas inconnu est également inconnu:
```
select *
from Common
where unknown
```
Où la condition de ne pas renvoyer des enregistrements où le résultat est inconnu, nous obtenons donc pas de documents.

Une façon de traiter cette question est d'utiliser le existe opérateur plutôt que dans. Existe ne retourne jamais inconnu parce qu'il fonctionne sur des lignes plutôt que des colonnes. (Une ligne existe ou qu'il n'en est rien; rien de tout cela nulle ambiguïté au niveau de la ligne!)
```
select *
from Common
where not exists (select common_id from Table1 where common_id = Common.common_id)
and not exists (select common_id from Table2 where common_id = Common.common_id)
```
InformationsquelleAutor Jeremy Stein
2

cela a fonctionné pour moi 🙂

select * from Commune

où

common_id pas dans (sélectionnez ISNULL(common_id, "dummy-data') de la table Table1)

et common_id pas dans (sélectionnez ISNULL(common_id, "dummy-data') de Table2)
- Très simple solution de contournement. Merci!
- les sous-requêtes retournent toujours 1 ou 0, et non pas une liste de valeurs. Alors, comment va la NOT IN y produire ?
InformationsquelleAutor arced

select *,
(select COUNT(ID)  from ProductMaster where ProductMaster.CatID = CategoryMaster.ID) as coun 
from CategoryMaster

InformationsquelleAutor Donga jayesh

Vous devez vous connecter pour publier un commentaire.