Data Catalog, Data Dictionary, Data Glossary… Quelles différences pour votre stratégie Data ?
Pour le réveillon, faites vous la différence entre un coquelet, une poularde ou un chapon ?
Et pour soutenir votre stratégie Data et transformer vos données en information et en connaissance métier de quoi avez-vous besoin ? Le vocabulaire de la Data est multiple, souvent complexe et les nuances aussi peu évidentes à appréhender et s’approprier que la différence entre une poule, un poulet, un coq, un chapon, une poularde, une poulette, un coquelet …
Alors, sans attendre Noël, aujourd’hui au menu, nous vous proposons une revue des différences entre « Data Dictionary », « Data Glossary » et « Data Catalog ».
Comment choisir la solution la mieux adaptée à votre besoin ? Adone Conseil vous donne les clés, aborder ces sujets en toute sérénité.
Data Glossary ou Glossaire de données
Il englobe l’ensemble des termes utilisés au sein de votre entreprise pour définir vos données. Il est le dictionnaire métier faisant foi dans votre organisation. Vous y trouverez l’ensemble des mots de vocabulaire utiles pour les personnes devant interagir avec vos données ainsi que leurs significations. Cet outil vous permet d’avoir une vision unifiée de vos données : pour chaque terme, une définition unique et commune existe, et est partagée au sein de votre organisation. Par exemple, vous y trouvez les définitions des indicateurs de performance (KPI) suivis et la signification de leurs acronymes, les descriptions des objets métier ou encore les axes d’analyses.
La particularité du Glossaire de données est qu’il est indépendant de toutes bases de données ou autre logiciel informatique au sein de votre entreprise, à la différence du Data Dictionary. Il vous permet de garder une vision unifiée des termes utilisés dans votre entreprise : une définition unique existe ainsi pour chaque terme.
Data Dictionary ou dictionnaire de données
Il regroupe les informations des bases de données et des systèmes informatiques de votre entreprise. Il regroupe les définitions et les descriptions détaillées de vos jeux de données (regroupés dans des tableaux) et de leurs valeurs (champs). Un dictionnaire de donnée vous permet de standardiser les informations sur vos données : chaque source de donnée est décrite dans un data dictionary selon le standard que vous choisissez : convention de nommage, source, typologie de donnée, taille, format, description, exemple… Il est le point d’entrée unique vers toutes les informations de vos différentes sources de données.
Source : sqlshack.com
Pour bien comprendre la différence entre ces deux concepts voici un récapitulatif qui met en lumière la différence entre Data Dictionary et Data Glossary :
Data Catalog ou catalogue de données
C’est un logiciel informatique vous permettant d’avoir une vue unifiée de l’ensemble des informations servant à décrire les données dans votre entreprise (type de fichier, origine, date, etc.). Cet outil permet de centraliser l’information, la standardiser et gérer les droits d’accès à vos bases de données. Ainsi le Data catalog englobe Data glossary et Data dictionary tout en y ajoutant des fonctionnalités de lineage (cartographie de la donnée pour connaître les sources, les tables dans lesquelles la donnée transite, les éventuelles transformations, de classification, de tag pour trouver l’information dont vous avez besoin plus facilement). Le Data catalog vous permet aussi de gérer la gouvernance de votre donnée : il permet de gérer les droits l’accès à vos bases de données, de savoir qui est « Owner » (propriétaire) ou « Steward » (agent) de vos données. Cet outil est donc très utile aussi pour responsabiliser les acteurs de la donnée dans vos organisations (par exemple qui est censé mettre à jour les informations) et savoir à qui s’adresser.
Conclusion
Le sujet des outils de pilotage et de gouvernance de la donnée est très vaste. Et pour accompagner votre stratégie Data et transformer vos données en information et en connaissance métier de quoi avez-vous besoin ? comment avoir accès à la donnée qui m’intéresse facilement ? comment l’exploiter ? comment organiser les acteurs autour de l’information ?
Et pour ne pas vous laisser sur votre faim :
- Le coquelet est un jeune coq
- La poularde est une jeune poule engraissée
- Le Chapon est un jeune coq châtré engraissé
- La poule n’est plus une poulette.
- Le poulet est une poulette ou un coquelet (en somme).
Adone Conseil vous accompagne dans la définition de votre stratégie de gestion de la donnée et la mise en œuvre de la transformation digitale de votre organisation.
N’hésitez plus, contactez-nous !