Formation : Gouvernance data lake

Cette formation propose une démarche pragmatique et itérative pour construire une gouvernance data adaptée à vos besoins. Elle est le fruit de retours d’expérience.

À la fin de la journée, ces questions ne resteront plus sans réponses :

  • Comment puis-je faire confiance aux données de mon data lake ?
  • Quelles données sont collectées et transvasées dans mon data lake ?
  • rythme et selon quelle stratégie d’intégration ?
  • Quels process et traitements sont faits sur mes données ?
  • Comment identifier le responsable de tel ou tel jeu de donnée ?
  • Comment puis-je y avoir accès ?
  • Puis-je avoir confiance en ces données ? Sont-elles de qualité ?
  • Comment partager au métier des données compréhensibles et exploitables ?
  • Comment limiter l’accès aux données personnelles ?

Vous pensiez insurmontable la mise en place d’une stratégie de “gouvernance de données” sur votre data lake ? Vous allez changer d’avis !

DATES DE LA FORMATION

  • Le 30 mars 2018
  • Le 20 juillet 2018
  • Le 16 novembre 2018

OFFRE EXCEPTIONNELLE

900 € HT à la place de 1 000 € HT pour la session du 30 mars 2018

Objectifs de la formation gouvernance data lake

À la suite de cette formation, les participants adresseront aisément les sujets suivants :

  • Identifier les actions à mettre en place pour construire une gouvernance sur son data lake.
  • Savoir démarrer un projet de gouvernance data lake avec les bons réflexes et les bons outils.

Programme de la formation gouvernance data lake

Introduction

Changement de paradigme : vers une vision centralisée des données

  1. L’histoire du Big Data
  2. Les enjeux des data lakes
  3. Exemples d’architecture de data lake

Démarrer son projet de gouvernance de data lake

  1. Bases de données traditionnelles vs. HDFS
  2. Inventorier la donnée
  3. Organiser les données
  4. Documenter les métadonnées

Définir les rôles et compétences clés

  1. DPO / Responsable de traitements
  2. Data governor / steward
  3. etc.

Sécuriser ses données

  1. Disponibilité
  2. Confidentialité
  3. Anonymisation
  4. Habilitation
  5. Audit

Mettre en place des workflows

  1. Mise à disposition de données
  2. Gérer les habilitations
  3. Se mettre en conformité avec la régulation

Gérer le cycle de vie des données

  1. Qualité de la donnée
  2. Lineage
  3. Régulation
  4. Nettoyage

Connecter les systèmes au data lake

  1. NoSQL
  2. Kafka
  3. Dataware
  4. etc.

Conclusion

Quelques mots sur le formateur

Cette formation d ‘une journée sera animée par Julien Buret.
Co-fondateur et CTO de Zeenea, Julien est intervenu dans la mise en place de nombreux data lakes et de solutions de gouvernance auprès de grands comptes (télécoms, finance, jeux en ligne, etc.). Julien est également un formateur Hadoop certifié par Cloudera depuis 2012.
Il a été nommé formateur européen de l’année 2014 par Cloudera. Julien anime régulièrement des ateliers techniques autour de thématiques liées au Big Data. Il a également été le vainqueur du Chalenge USI 2011 (développement d’une application web scalable pour plusieurs millions d’utilisateurs).

Le public attendu

  • Chef de projet Big Data
  • Architecte Big Data
  • Data Governor / Data Steward

Les prérequis

Des connaissances générales sur les architectures Big Data sont attendues.

Validation

À la fin de cette formation, les stagiaires recevront une attestation de présence.

NOTRE PARTENAIRE

Notre formation est accueillie et organisée avec notre partenaire Xebia Training

Vous souhaitez participer à la formation gouvernance data lake ?