Eléonore Caiveau-Partula
Après 10 ans en audit financier et conseil dans des cabinets de premier rang, Eléonore, a acquis une solide connaissance des organisations et de leur système d’information.
Le projet FUZEO repose sur la conviction que l’exploitation pragmatique et dynamique des données par les métiers participe au meilleur pilotage des organisations.
Article écrit par Eléonore Caiveau-Partula le 3 mars 2021
Professionnels du chiffres, ne faites pas l’impasse sur la modélisation dimensionnelle de vos données
Pour progresser dans la modélisation de vos rapports, nous vous recommandons de ne pas faire l’impasse sur les notions de base de données relationnelles.
En tant que professionnels du chiffre, nous avons coutume de requêter des fichiers comprenant un maximum de colonnes venant enrichir des informations chiffrées par exemple :
Une table de ventes avec l’ensemble des champs suivants :
– Date
– Montant
– Commercial
– Client
– Produit
– Code article
– Localisation
– Code postale
– …
Les champs sont les en-têtes de vos colonnes !
Ce qui doit vous alerter c’est le nombre de colonnes !
Plus une table comprend de colonnes plus celle-ci est lourde et vous empêchera de penser à une modélisation efficace de vos données.
De manière vulgarisée, modéliser c’est récréer un modèle efficace alliant faits et dimensions.
Les dimensions enrichissent l’analyse de faits chiffrées.
Dans la table précédemment présentée nous pouvons flagger chaque champ de la manière suivante :
– Date -> Dimension
– Montant -> Fait
– Commercial -> Dimension
– Client -> Dimension
– Produit -> Dimension
– Code article -> Dimension
– Localisation -> Dimension
– Code postale -> Dimension
– …
Chaque dimension peut être portée par une table de dimension portant plusieurs attributs pouvant enrichir l’analyse d’une table de faits.
La modélisation la plus sûre pour commencer est la modélisation suivante issus du modèle en étoile de Ralph Kimball :
Nous vous recommandons de nommer vos tables de la manière suivante :
– Table de faits : F_Nom_ table_faits
– Table de dimension : D_Nom_table_dimension
Dans ce modèle, nous vous recommandons des relations unilatérales allant de la table de dimension à la table de fait.
Au niveau de la table de dimension, le champ ID (exemple : ID Client) ne doit présenter aucun doublon sinon vos analyses seront biaisées.
Au niveau de la table de faits, le champ ID peut présenter des doublons car un même client a pu acheter différents articles à deux moments différents.
Un peu de littérature pour aller plus loin :
– Base de données relationnelles — Wikipédia (wikipedia.org)
– Modèle relationnel — Wikipédia (wikipedia.org)
– Fact table – Wikipedia
Des références incontournables :
– Ralph Kimball l’inventeur du modèle en étoile
– Étoile (modèle de données) — Wikipédia (wikipedia.org)
Retrouver notre article et réagissez sur : https://www.pbiusergroup.com/communities/community-home?CommunityKey=c99fec72-cdfa-41bd-9ff8-4861bb83999b