Menu Recherche Panier
(...)
Vous êtes ici : Accueil > Catalogue des formations > Formation Big Data - Les fondamentaux de l'analyse des données
TechniqueNouveauté

Formation Big Data - Les fondamentaux de l'analyse des données

Acquérir une première expérience du BigData

Comprendre les besoins métier pour livrer aux décideurs des indicateurs fiables et pertinents, tel est le rôle attendu des spécialistes Big Data. Précisément conçu pour leur apporter une première approche de la mise en oeuvre d'une solution de Big Data en environnement Hadoop, solution phare pour les traitements Big Data, ce programme reprend le cheminement logique d’un projet d’analyse de données. De leur collecte initiale à la mise en place d’une solution de stockage HDFS permettant d’organiser un très grand volume d’information, à l'initiation a la réalisation de programmes Pig et Hive qui, convertis en tâches MapReduce, permettent d’agréger et de filtrer les données pour finalement les analyser, tous les aspects seront abordés.
Objectifs de cette formation Big Data - Les fondamentaux de l'analyse des données
  • Comprendre le rôle stratégique de la gestion des données pour l’entreprise
  • Identifier ce qu’est la donnée, et en quoi consiste le fait d’assurer la qualité de données
  • Synthétiser le cycle de vie de la donnée
  • Assurer l’alignement des usages métiers avec le cycle de vie de la donnée
  • Découvrir les bonnes pratiques en matière de contrôle de qualité des données
  • Assurer la mise en oeuvre de la gouvernance de la donnée
  • Disposer d’un premier aperçu des possibilités de traitement proposé par MapR et Hadoop
Public
  • MOA, Chef de projet, Urbaniste fonctionnel, Responsable de domaine, Analystes, Développeurs, Data Miners ...
  • Futurs Data Scientists, Data Analysts et Data Stewards
Pré-requis
Programme détaillé
En présentielEn Présentiel

Introduction

  • Les origines du Big Data
  • La donnée en tant que matière première
  • La connaissance de la question
  • Big Data, Données, qualité et stratégie d’entreprise
  • Problématiques d’alignement de la qualité de la donnée avec les usages métiers
  • Les différentes sources de données de l'entreprise, de l’Internet, des objets connectés
  • Les différentes formes d'exploitation de données
  • Système d'information opérationnel
  • Système d'information décisionnel
  • Big Data et smart Data

La collecte de données

  • Où et comment collecter des données ?
  • Les sources de données, les API, les fournisseurs, les agrégateurs...
  • Les principaux outils de collecte et de traitement de l’information (ETL)
  • Les particularités de la collecte des données semi-structurées et non-structurées

Le stockage des données

  • Les différentes formes de stockage des données : rappel de l’architecture relationnelle de stockage des données transactionnelles (SGBD/R) et multidimensionnelles (OLAP)
  • Prise en main d’une base de données OLAP
  • Les nouvelles formes de stockage des données - compréhension, positionnement et comparaison : Bases NoSQL, Hadoop, Spark, Bases de données graph...
  • Panorama des bases de données NoSQL
  • Particularités liées au stockage des données non-structurées
  • Comment transformer des données non structurées en données structurées

L’écosystème Hadoop

  • Présentation des principaux modules de la distribution Apache Hadoop
  • Présentation et comparaison des principales distributions commerciales (Cloudera, Hortonworks...)
  • L’infrastructure matérielle et logicielle nécessaire au fonctionnement de Hadoop
  • Serveur local ou cloud
  • Les concepts de base de l’architecture Hadoop: Data Node, Name Node, Job Tracker, Task Tracker
  • Présentation de HDFS (Système de gestion des fichiers de Hadoop)
  • Présentation de MapReduce (Outil de traitement de Hadoop)
  • Les commandes exécutées au travers de PIG
  • Présentation de HIVE pour transformer du SQL en MapReduce

L'analyse de données

  • Comment requêter les données ?
  • Analyser et comprendre la signification des données extraites
  • Particularités liées à l’analyse des données non structurées
  • Analyse prédictive : transformer des données du passé en prévisions pour le futur
  • Calculer des tendances
  • Machine Learning : les bases de l’apprentissage machine
  • Deep Learning : notions de base de l’analyse future automatisée de données non structurées

Transformer les données en décisions

  • Comprendre les besoins et les attentes des utilisateurs business
  • Traduire les demandes des utilisateurs en requêtes
  • Évaluer et vérifier la qualité des données extraites en fonction des résultats obtenus
  • Définir un indice de confiance permettant d’échanger avec les utilisateurs business
Après le présentielAprès le Présentiel
Retrouvez sur le Learning Hub ib :
  1. un vidéocast :
  2. > L'écosystème Hadoop
  3. deux vidéo-tutos :
  4. > Installation d'un environnement Hadoop de base
  5. > Développement d'un premier MapReduce
Les plus de cette formation Big Data - Les fondamentaux de l'analyse des données
  • Une formation très opérationnelle durant laquelle s'alternent les phases d'apports théoriques, d'échanges, de partage d'expériences.
  • Un panorama exhaustif des outils du Big Data.
  • L'apprentissage par la pratique : les ateliers proposés permettent aux participants d'acquérir une première expérience.
  • Les retours d'expérience et conseils de consultants experts.

Informations

Dimension Digitale

  • Durée : 3 Jours (21h)
  • Tarif : 1 930 € HT
  • Réf. : BD540
  • Option(s)
    • Repas Paris : 69 € HT


Dates des sessions
Session garantie Formation à distance Session accessible à distance Visio
Bon à savoir...




= une réponse possible
= plusieurs réponses possibles

Vous n'avez pas répondu à toutes les questions !
Vous avez % de bonnes réponses, vous pouvez donc suivre cette formation.
Vous avez % de bonnes réponses.
Nous vous invitons à contacter nos Conseillers Formation au 0825 07 6000 afin qu'ils vous orientent vers une formation plus adaptée à vos connaissances.