Sélection de MIN et MAX De la Table est plus lent que prévu

J'ai une table MYTABLE avec une colonne de date SDATE qui est la clé primaire de la table et a un index unique sur elle.

Lorsque j'exécute cette requête:

SELECT MIN(SDATE) FROM MYTABLE

il donne la réponse instantanément. Le même phénomène se produit pour:

SELECT MAX(SDATE) FROM MYTABLE

Mais, si j'ai une requête à la fois ensemble:

SELECT MIN(SDATE), MAX(SDATE) FROM MYTABLE

il prend beaucoup plus de temps à s'exécuter. J'ai analysé les plans et trouvé lorsque l'un des min ou max est interrogé, il utilise des INDEX FULL SCAN(MIN/MAX), mais quand les deux sont interrogés dans le même temps, il fait un FULL TABLE SCAN.

pourquoi?

Données De Test:

version 11g

create table MYTABLE
(
  SDATE  DATE not null,
  CELL   VARCHAR2(10),
  data NUMBER
)
tablespace CHIPS
  pctfree 10
  pctused 40
  initrans 1
  maxtrans 255
  storage
  (
    initial 64K
    minextents 1
    maxextents unlimited
  );

alter table MYTABLE
  add constraint PK_SDATE primary key (SDATE)
  using index 
  tablespace SYSTEM
  pctfree 10
  initrans 2
  maxtrans 255
  storage
  (
    initial 64K
    minextents 1
    maxextents unlimited
  );

De la table de chargement:

declare 
  i integer;
begin
  for i in 0 .. 100000 loop
     insert into MYTABLE(sdate, cell, data)
     values(sysdate - i/24, 'T' || i, i);     
     commit;
  end loop;
end;

Recueillir des statistiques:

begin
  dbms_stats.gather_table_stats(tabname => 'MYTABLE', ownname => 'SYS');
end;

Plan 1:

Sélection de MIN et MAX De la Table est plus lent que prévu

Plan2:

Sélection de MIN et MAX De la Table est plus lent que prévu

Le nombre de lignes dans la table? Comment les frais sont les statistiques?
Ma table a presque 100000 lignes et les stats sont frais; vous pouvez facilement re-générer le problème par la création d'un tableau simple avec seulement un ou deux colonnes et de voir les résultats pour vous-même.
quels sont les coûts pour les requêtes? pouvez-vous poster les plans? Je pense que l'index est très fragmenté.
tablespace SYSTEM? veuillez essayer un autre.
C'est mon petit environnement de test donc je n'ai pas le SYSTÈME de soins de tablespace. mais de toute façon la même chose qui se passe sur la production de la table.
Merci de ne pas prendre de mauvaises habitudes: (1) Ne pas créer des objets dans le schéma SYS, jamais. (2) ne s'engagent pas dans une boucle.
Je vais prendre vos conseils!!! Merci. 🙂

InformationsquelleAutor RGO | 2012-09-24

12

L'Index Scan Complet seulement un côté de l'index. Quand vous faites
```
SELECT MIN(SDATE), MAX(SDATE) FROM MYTABLE
```
vous demandez à visiter, des 2 côtés. Par conséquent, si vous souhaitez à la fois le minimum et le maximum de la valeur de la colonne, un Indice de l'Analyse Complète n'est pas viable.

Plus détaillée analyser vous pouvez trouver ici.
- Le lien que vous avez, ne fournit aucune explication pour ce comportement. Il n'a pas répondu pourquoi l'index ne peut pas être (ou non) utilisés pour trouver à la fois le MIN et le MAX.
- +1 pour fournir la bonne réponse et un lien vers Richard Foote l'excellent billet de blog autour de ce sujet.
- À propos, que pensez-vous est tout ce qui parle dans le lien que j'ai donné, si elle n'explique pas pourquoi les Index Full Scan ne fonctionne pas de cette requête? et tnx Rob van Wijk
- Je doute que cette réponse est tout à fait correcte. Cette requête: SELECT MIN(SDATE), MIN(SDATE) FROM MYTABLE aussi est différent! Veuillez voir mon post mis à jour.
- il est possible que l'insolite (et inutile) de la requête SELECT MIN(SDATE), MIN(SDATE) FROM MYTABLE est en quelque sorte provoquant Oracle de ne pas détecter l'optimisation que pour les SELECT MIN(SDATE) FROM MYTABLE. Cependant, dans mon test (11gR2) l'optimisation fonctionne très bien, même avec clauses redondantes dans le select.
- Vous pensez que ça pourrait optimiser loin dans les 2 index des analyses complètes donné il n'y a pas d'autres colonnes dans la requête et pas de regroupement par quoi que ce soit.
InformationsquelleAutor avi
6

L'expliquent les plans sont différents: un seul MIN ou MAX va produire un INDEX FULL SCAN (MIN/MAX) alors que quand les deux sont présents, vous obtiendrez un INDEX FULL SCAN ou un RAPIDE ANALYSE d'INDEX.

Pour comprendre la différence, nous devons nous pencher pour une description d'un INDEX COMPLET SCAN:

Dans un index complet d'analyse, la base de données lit la totalité de l'index dans l'ordre.

En d'autres termes, si l'index est sur un VARCHAR2 champ, Oracle va chercher le premier bloc de l'index qui contiendrait par exemple toutes les entrées qui commencent par la lettre "A" et le lire bloc par bloc, toutes les entrées par ordre alphabétique jusqu'à ce que la dernière entrée ("A" à "Z"). Oracle peut traiter de cette façon parce que les entrées sont triées dans un arbre binaire de l'index.

Quand vous voyez INDEX FULL SCAN (MIN/MAX) en expliquer le plan, qui est le résultat d'une optimisation qui utilise le fait que, depuis les entrées sont triées, vous pouvez vous arrêter après avoir lu la première, si vous êtes uniquement intéressé par la MIN. Si vous êtes intéressé dans le MAX seulement, Oracle peut utiliser le même chemin d'accès, mais cette fois en commençant par la dernière entrée et de lecture en arrière à partir de "Z" à "Une".

Dès maintenant, un FULL INDEX SCAN a une seule direction (vers l'avant ou vers l'arrière) et ne peut pas commencer à partir de deux extrémités simultanément, c'est pourquoi, lorsque vous demandez à la fois le min et le max, vous bénéficiez d'une moins efficace méthode d'accès.

Comme suggéré par d'autres réponses, si la requête a besoin critique de l'efficacité, vous pouvez exécuter votre propre optimisation par recherche pour le min et le max dans les deux requêtes distinctes.
- Ma première pensée fut: pourquoi un index complet scan? Pourquoi ne pas demander? Mais depuis, il s'arrête après la première valeur lue puis qui fait sens, c'est juste une étape, vs un index de recherche qui serait composé de plusieurs étapes à pied du b-arbre. Merci pour les expliquer, de les expliquer.
InformationsquelleAutor Vincent Malgrat
5

Essayez de ne pas sélectionner les deux bords de l'indice dans une requête ,
Accédant à la requête d'une manière différente comme ceci :
```
select max_date, min_date
from (select max(sdate) max_date from mytable),
       (select min(sdate) min_date from mytable)
```
sera la cause de l'optimiseur pour accéder à l'index dans INDEX_FULL_SCAN(MIN/MAX) dans les boucles imbriquées (dans notre cas , deux fois).
- J'allais proposer la même solution, mais votre réponse ne le magique, surprenant de constater que le moteur sql n'est pas assez intelligent pour comprendre cela automatiquement, lol
InformationsquelleAutor planben
2

Je dois dire que je ne vois pas le même comportement dans 11.2

Si j'ai mis un cas de test comme suit et mis à jour à partir de 10k à 1m de lignes en réponse à Vincent commentaire
```
set linesize 130
set pagesize 0
create table mytable ( sdate date );

Table created.

insert into mytable
 select sysdate - level
   from dual
connect by level <= 1000000;
commit;

1000000 rows created.


Commit complete.

alter table mytable add constraint pk_mytable primary key ( sdate ) using index;

Table altered.

begin
dbms_stats.gather_table_stats( user, 'MYTABLE' 
                             , estimate_percent => 100
                             , cascade => true
                               );
end;
/

PL/SQL procedure successfully completed.
```
Ensuite, l'exécution de vos requêtes-je obtenir presque identiques à la recherche expliquent les plans (notez les différents types d'INDEX FULL SCAN)
```
explain plan for select min(sdate) from mytable;
Explained.
select * from table(dbms_xplan.display);
Plan hash value: 3877058912
-----------------------------------------------------------------------------------------
| Id  | Operation          | Name   | Rows  | Bytes | Cost (%CPU)| Time |
-----------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT       |        |     1 |     8 |     1   (0)| 00:00:01 |
|   1 |  SORT AGGREGATE        |        |     1 |     8 |        |      |
|   2 |   INDEX FULL SCAN (MIN/MAX)| PK_MYTABLE |     1 |     8 |     1   (0)| 00:00:01 |
-----------------------------------------------------------------------------------------
9 rows selected.
explain plan for select min(sdate), max(sdate) from mytable;
Explained.
select * from table(dbms_xplan.display);
Plan hash value: 3812733167
-------------------------------------------------------------------------------
| Id  | Operation    | Name       | Rows  | Bytes | Cost (%CPU)| Time     |
-------------------------------------------------------------------------------
|   0 | SELECT STATEMENT |        |     1 |     8 |   252   (0)| 00:00:04 |
|   1 |  SORT AGGREGATE  |        |     1 |     8 |        |          |
|   2 |   INDEX FULL SCAN| PK_MYTABLE |  1000K|  7812K|   252   (0)| 00:00:04 |
-------------------------------------------------------------------------------
9 rows selected.
```
Pour citer un à la réponse précédente de la mine:
Les deux raisons les plus courantes pour une requête de ne pas utiliser les index sont:
1. C'est plus rapide de faire un full table scan.
2. Mauvaises statistiques.
Moins qu'il y a quelque chose que vous n'êtes pas poster dans la question, ma réponse serait que vous n'avez pas recueilli des statistiques sur ce tableau, vous n'avez pas a recueillis avec un haut assez estimation pour cent ou que vous avez utilisé analyse, qui pas aider l'Optimiseur Basé sur les Coûts, contrairement à dbms_stats.gather_table_stats.

Des extraits de la documentation sur analyze:

Pour la collecte de la plupart des statistiques, l'utilisation de la DBMS_STATS paquet,
qui permet de collecter des statistiques en parallèle, de recueillir mondiale
statistiques de partitionner les objets, et d'affiner vos statistiques
collection dans d'autres façons. Voir la Base de données Oracle PL/SQL et les Paquets
Types de Référence pour plus d'informations sur le DBMS_STATS paquet.

Utiliser l'analyse de résultats (plutôt que DBMS_STATS) pour les statistiques
la collection ne sont pas liées à l'optimiseur basé sur les coûts:
- Je viens juste de voir que vous avez des commentaires indiquant 100k lignes, mais re-faire avec ce montant ne fait pas de différence.
- J'ai fourni des données dans mon post. Je l'ai également fait moi-même, encore et obtenu les mêmes résultats avec 11.1.
- 10k est chétif 🙂 essayez avec 1M de lignes, vous devriez voir une différence
- Aussi la différence en expliquer le plan est très grande: la INDEX FULL SCAN (MIN/MAX) va s'arrêter après la première ligne récupérée (colonne rows=1) alors que la INDEX FULL SCAN permettra de lire tous les index de blocs (colonne rows=10000) c'est 10000 fois plus de travail ! (à peu près 🙂
- on dirait que je suis pour être mise en doute toute ma vie :-). Je l'ai mis à jour à 1m de lignes.
- J'essayais d'attirer l'attention sur ce qui a été écrit plutôt que de la sortie; je l'ai mis à jour à "presque identique cherche"... @VincentMalgrat.
- ANALYSE COMPLÈTE (MIN/MAX) n'est pas vraiment un complet index scan?
- c'est une version optimisée de la INDEX FULL SCAN qui va arrêter le scan complet après la première entrée trouvée pour répondre à la condition, dans ce cas, la première ligne. Je peux voir comment le nom peut être trompeur 🙂
- ils regardent presque sur le même 🙂 et en fait je suis d'accord que la différence de temps semble plutôt petit (de 0,01 à 0,04), mais la quantité de travail doit varier beaucoup je soupçonne (pouvez-vous exécuter à la fois des relevés avec AUTOTRACE TRACEONLY?)
InformationsquelleAutor Ben

Vous devez vous connecter pour publier un commentaire.