Un catalogue de données est un portail regroupant les métadonnées sur les jeux de données collectés par l’entreprise. Ces informations classées et organisées permettent aux data users de (re)trouver des jeux de données pertinents pour leur travail.

Une nouvelle vague de catalogues de données apparaît sur le marché. Ils ont pour objectif d’inscrire une entreprise dans une démarche data-driven. N’importe qui dans l’entreprise doit – s’il est habilité – être capable d’accéder, comprendre les données et contribuer dans leur documentation et ce, sans avoir de compétences techniques. On parle de self-service de la donnée.

Zeenea a identifié les 4 caractéristiques que doit respecter un catalogue de données nouvelle génération. Il doit être :

  1. Un catalogue de donnée d’entreprise.
    Un catalogue de données doit se connecter à toutes les sources de données de l’entreprise pour venir collecter et regrouper toutes les métadonnées en un seul endroit centralisé et ainsi, éviter la multiplication d’outils.
  2. Un catalogue de données connecté.
    Nous croyons qu’un catalogue de données doit toujours être à jour et précis sur les informations qu’il renseigne pour être utile auprès de ses utilisateurs. En étant connecté aux sources de données, le catalogue de données peut importer la documentation depuis les systèmes de stockage et assurer une mise à jour automatique des métadonnées dans les deux structures (storages et catalogue de données).
  3. Un catalogue de données collaboratif.
    Dans une approche user centric, un catalogue de données doit être l’outil data de référence d’une entreprise. En impliquant les employés grâce à des fonctionnalités collaboratives, l’entreprise bénéficie de l’intelligence collective. Partager, assigner, commenter, qualifier à l’intérieur même du catalogue de données pour augmenter la productivité et la connaissance auprès de tous vos collaborateurs.
  4. Un catalogue de données intelligent.
    En choisissant un catalogue de données doté d’une intelligence artificielle pour l’auto-population de métadonnées, par exemple, c’est permettre à vos gestionnaires de données de gagner en efficacité.

Ces caractéristiques feront l’objet d’articles détaillés, suivez-nous sur LinkedIn.