Est une table de faits dans normalisé ou de-forme normalisée?
J'ai fait un peu de R&D sur les tables de faits, s'ils sont normalisées ou de-normalisée.
Je suis tombé sur quelques constatations qui me rendent confus.
Selon Kimball:
Modèles tridimensionnels à combiner normalisé et dénormalisée structures de la table. Les tables de dimension d'informations descriptives sont très anormale et détaillées hiérarchique roll-up des attributs dans la même table. Pendant ce temps, les tables de faits avec des mesures de la performance sont généralement normalisées. Alors que nous vous déconseillons totalement normalisé avec flocons attributs de la dimension dans des tables séparées (création de blizzard comme des conditions pour l'utilisateur de l'entreprise), un seul dénormalisée grand et large table contenant à la fois des mesures et descriptions dans le même tableau est également déconseillé.
Les autres à trouver, que j'ai aussi, je pense, ok, par fazalhp à GeekInterview:
Le principal funda de DW est de normaliser les données pour un accès plus rapide par l'outil de reporting...donc si ur la construction d'un DW ..90%, il doit être de-normalisée et bien entendu la table de faits doit être normalisé de...
Donc ma question est, sont en fait des tables normalisées ou de-normalisée? Si aucune de ces choses, alors comment & pourquoi?
OriginalL'auteur Aditya | 2014-03-28
Vous devez vous connecter pour publier un commentaire.
Du point de base de données relationnelle de théorie du design, des tables de dimension sont généralement en 2FN tables de faits et de n'importe où entre 2FN et 6NF.
Cependant, les dimensions de la modélisation est un méthodologie en lui-même, adapté à:
un cas d'utilisation, à savoir les rapports
surtout un type de base (pattern) d'une requête
l'un des principaux utilisateurs de la catégorie -- analyste d'affaires, ou similaire
ligne magasin SGBD comme Oracle, SQl Server, Postgres ...
un gérée de façon indépendante de la charge/processus de mise à jour (ETL); tous les autres clients sont en lecture seule
Il y a d'autres DW méthodologies de conception, comme
Inmon est -- structure de données conduit
De données de coffre-fort-structure de données conduit
D'ancrage de la modélisation -- l'évolution des schémas conduit
La chose principale est de ne pas mélanger-up de conception de base de la théorie avec la conception spécifique de la méthodologie. Vous pouvez regarder une certaine méthodologie de conception de base de données perspective de la théorie, mais ont à l'étude de chaque méthodologie séparément.
OriginalL'auteur Damir Sudarevic
Plupart des gens qui travaillent avec un entrepôt de données sont familiers avec transactionnel SGBDR et d'appliquer différents niveaux de la normalisation, de sorte que ces concepts sont utilisés pour décrire le travail d'un schéma en étoile. Ce qu'ils font est d'essayer de vous oublier tous ceux normalisation habitudes. Cela peut être source de confusion car il y a une tendance à se concentrer sur ce "pas" à faire.
La table de faits(s) sera probablement le plus normalisé, car ils contiennent généralement des juste valeurs numériques ainsi que divers id pour lier les dimensions. Ils clé de tables de faits est la façon granulaire avez-vous besoin pour obtenir vos données. Un exemple pour les Achats pourraient être des éléments spécifiques par produit dans une commande ou agrégées à un quotidien, hebdomadaire, mensuel.
Ma suggestion est de garder à la recherche et à l'étude de la conception d'un entrepôt en fonction de vos besoins. Ne pas chercher à obtenir des niveaux élevés de formes normalisées. Réfléchir sur les rapports que vous souhaitez générer et les capacités d'analyse pour donner à vos utilisateurs.
OriginalL'auteur JeffO