Menu Recherche Panier
(...)
Vous êtes ici : Accueil > Catalogue des formations > Formation Big Data - Gouvernance, qualité et traitement des données
Technique

Formation Big Data - Gouvernance, qualité et traitement des données

Qualification de données pour les projets Big Data

Le défi des entreprises de nos jours est de pouvoir se développer dans le contexte chaotique de l’économie mondialisée. Cet état de fait les oblige à adapter en permanence leurs SI en prenant en compte des processus métiers de plus en plus riches, une architecture fonctionnelle et logicielle de plus en plus complexe et des technologies en constante évolution. Depuis quelques années, de nouvelles sources de données sont apparues encore plus déstabilisantes car souvent non structurées comme par exemple, les objets connectés ou ce qui se passe sur Internet. Destinée aux professionnels en charge des données, de leur qualité et de leur alignement sur les besoins et usages métiers de l’entreprise, cette formation apporte les compétences nécessaires pour identifier, collecter et s’assurer de la qualité de l’information.
Objectifs de cette formation Big Data - Gouvernance, qualité et traitement des données
  • Comprendre le rôle stratégique de la gestion des données pour l’entreprise
  • Identifier ce qu’est la donnée, et en quoi consiste le fait d’assurer la qualité de données
  • Synthétiser le cycle de vie de la donnée
  • Assurer l’alignement des usages métiers avec le cycle de vie de la donnée
  • Découvrir les bonnes pratiques en matière de contrôle de qualité des données
  • Assurer la mise en oeuvre de la gouvernance de la donnée
  • Disposer d’un premier aperçu des possibilités de traitement proposé par MapR et Hadoop
Public
  • Toute personne en charge d’assurer la qualité des données et la mise sous contrôle des référentiels dans un projet Big Data (MOA, Chef de projet, Urbaniste fonctionnel, Responsable de domaine, Analystes, Développeurs, Data Miners ...)
  • Futurs Data Scientists, Data Analysts et Data Stewards
Pré-requis
Programme détaillé

Introduction

  • Les origines du Big Data
  • La donnée en tant que matière première
  • La connaissance de la question
  • De la qualité à la qualité de la donnée ?
  • Big Data, Données, qualité et stratégie d’entreprise
  • Problématiques d’alignement de la qualité de la donnée avec les usages métiers
  • Les différentes sources de données de l'entreprise, de l’Internet, des objets connectés
  • Les différentes formes d'exploitation de données
  • Système d'information opérationnel
  • Système d'information décisionnel
  • Big Data et smart Data

Enjeux, définition et problématiques liés à la qualité de la donnée Big Data, le 4eme V, la véracité

  • Enjeux de mise sous contrôle des référentiels et qualité de la donnée
  • Définition et approches du Big Data
  • Définition de l’information en entreprise, sur Internet, issus des objets connectés
  • Définition de la notion de données en entreprise (Granularité)
  • Identification du cycle de vie de la donnée
  • Enjeux de la maîtrise de la donnée
  • Identification de la notion "qualité des données"
  • Évaluation de la qualité des données Big data
  • Niveau d'approche et de granularité
  • Réconciliation des données
  • Une urbanisation de la donnée est-elle possible ?
  • Gouvernance de la donnée

Cycle de vie et qualité de la donnée

  • Cycle de vie et gestion de la qualité de la donnée
  • Création
  • Collecte
  • Stockage, base à chaud, base à froid
  • Exploitation
  • Archivage
  • Nettoyage, Suppression, est-ce possible en Big Data ?
  • Audit de l’intégrité et de de la qualité
  • Identification la non qualité des données
  • Traitement de la non qualité des données
  • Gestion de la qualité des données.

Alignement des usages métiers et gouvernance de la donnée Big Data

  • Analyse des usages sur la donnée et impacts sur la qualité de la donnée Big Data structurée ou non
  • Identification des usages de la donnée de demain et impact sur la qualité de la donnée
  • Urbanisation de la donnée, qualité du Big data et de bonnes pratiques
  • Stratégie de gestion de la qualité de la donnée
  • ­Évaluation de la qualité de donnée
  • Principes de gouvernance de la donnée et impacts sur la qualité

Urbanisation, mise sous contrôle des référentiels et qualité de la donnée

  • Démarche d’urbanisation
  • Mise sous contrôle de la donnée Big Data
  • Mise en oeuvre de la qualité de la donnée
  • Transformation de l’organisation et impact sur la qualité de la donnée
  • Moyens d’assurer la qualité de la donnée
  • Réconciliation avec les référentiels internes

Outils et méthodes pour assurer la qualité de la donnée

  • Outils de gestion des référentiels
  • Outils de gestion de la qualité de données
  • Principes d’architecture et de mise en oeuvre

Le traitement de données

  • Considérations techniques du traitement de données en masse
  • Introduction au calcul distribué
  • Exemples d’architectures distribuées
Les plus de cette formation Big Data - Gouvernance, qualité et traitement des données
  • Les règles de construction d'un référentiel métier pour assurer la cohérence des données.
  • Les retours d'expérience et conseils de consultants experts.

Informations

  • Durée : 3 Jours (21h)
  • Tarif : 1 930 € HT
  • Réf. : BD540
  • Option(s)
    • Repas Paris : 69 € HT


Financement
Dates des sessions
Session garantie Formation à distance Session accessible à distance Visio
Bon à savoir...

= une réponse possible
= plusieurs réponses possibles

Vous n'avez pas répondu à toutes les questions !
Vous avez % de bonnes réponses, vous pouvez donc suivre cette formation.
Vous avez % de bonnes réponses.
Nous vous invitons à contacter nos Conseillers Formation au 0825 07 6000 afin qu'ils vous orientent vers une formation plus adaptée à vos connaissances.