
Data Catalog, Data Dictionary, Data Glossary… Quelles différences pour votre stratégie Data ?
Entre une pâquerette, une marguerite et une camomille… pas toujours évident de s’y retrouver, non ? C’est un peu pareil avec la Data.
Entre Data Catalog, Data Glossary et Data Dictionary, les termes se ressemblent, mais leurs usages et leurs objectifs sont bien différents. Et pour cultiver efficacement votre stratégie Data, mieux vaut savoir précisément ce que vous plantez… et pourquoi !
Comment choisir la solution la mieux adaptée à votre besoin ? Adone Conseil vous donne les clés pour aborder ces sujets en toute sérénité.
Data Glossary ou Glossaire de données
Il englobe l’ensemble des termes utilisés au sein de votre entreprise pour définir vos données. Il est le dictionnaire métier faisant foi dans votre organisation. Vous y trouverez l’ensemble des mots de vocabulaire utiles pour les personnes devant interagir avec vos données ainsi que leurs significations. Cet outil vous permet d’avoir une vision unifiée de vos données : pour chaque terme, une définition unique et commune existe, et est partagée au sein de votre organisation. Par exemple, vous y trouvez les informations suivantes :
- Les définitions des indicateurs de performance clés (KPI for Key Performance Indicators)
- La signification des acronymes
- Les descriptions des objets métier
- Les axes d’analyses
Il est le point d’entrée unique vers toutes les informations de vos différentes sources de données.
Data Dictionary ou dictionnaire de données
Il regroupe les informations des bases de données et des systèmes informatiques de votre entreprise. Il regroupe les définitions et les descriptions détaillées de vos jeux de données (regroupés dans des tableaux) et de leurs valeurs (champs). Un dictionnaire de données vous permet de standardiser les informations sur vos données : chaque source de donnée y est décrite selon le standard que vous choisissez :
- Convention de nommage
- Source
- Typologie de donnée
- Taille
- Format
- Description
- Exemple de données en sortie
Pour bien comprendre la différence entre ces deux concepts voici un récapitulatif qui met en lumière la différence entre Data Dictionary et Data Glossary :
Data Catalog ou catalogue de données
Cet outil informatique vous permet d’avoir une vue unifiée de l’ensemble des informations servant à décrire les données dans votre entreprise (type de fichier, origine, date, etc.).
Il permet de :
- Centraliser l’information
- Standardiser l’information
- Gérer les droits d’accès à vos bases de données
Ainsi le Data Catalog englobe Data Glossary et Data Dictionary tout en y ajoutant des fonctionnalités de Data Lineage : cartographie de la donnée pour connaître les sources, les tables dans lesquelles la donnée transite, les éventuelles transformations, classifications, tags pour trouver l’information dont vous avez besoin plus facilement.
Le Data Catalog vous permet aussi de gérer la gouvernance de vos données : il permet de gérer les droits d’accès à vos bases de données, de savoir qui est « Owner » (propriétaire) ou « Steward » (agent) de vos données. Cet outil est donc très utile aussi pour responsabiliser les acteurs de la donnée dans vos organisations (par exemple qui est censé mettre à jour les informations) et savoir à qui s’adresser.
Conclusion
Le sujet des outils de pilotage et de gouvernance de la donnée est très vaste. Et pour accompagner votre stratégie Data et transformer vos données en information et en connaissance métier de quoi avez-vous besoin ? comment avoir accès à la donnée qui m’intéresse facilement ? comment l’exploiter ? comment organiser les acteurs autour de l’information ?
Comme dans un jardin bien pensé, chaque élément doit être à sa place et remplir une fonction précise. Car entre une pâquerette, une marguerite et une camomille, les différences ne sautent pas toujours aux yeux… et pourtant, elles existent bel et bien. Chacune a ses particularités, ses usages, sa valeur.
Il en va de même pour le Data Dictionary , le Data Glossary et le Data Catalog : des outils complémentaires, à bien distinguer, pour faire pousser une stratégie Data cohérente et durable. Alors, à vous de choisir les bonnes graines… et de faire fleurir la connaissance au sein de votre organisation.
Adone Conseil vous accompagne dans la définition de votre stratégie de gestion de la donnée et la mise en œuvre de la transformation digitale de votre organisation.