Menu Recherche Panier
(...)
Vous êtes ici : Accueil > Catalogue des formations > Formation Big Data - Mise en oeuvre pratique d'une solution complète d'analyse des données
TechniqueNouveauté

Formation Big Data - Mise en oeuvre pratique d'une solution complète d'analyse des données

Collecte et analyse de données massives

Comprendre les besoins métier pour livrer aux décideurs des indicateurs fiables et pertinents, tel est le rôle attendu des spécialistes Big Data. Précisément conçu pour leur apprendre à mettre en oeuvre une solution de Big Data en environnement Hadoop, solution phare pour les traitements Big Data, ce programme reprend le cheminement logique d’un projet d’analyse de données. De leur collecte initiale à la mise en place de solutions de stockage spécifiques permettant d’organiser un très grand volume d’information, à la réalisation de scripts Pig et Hive qui, convertis en tâches MapReduce, permettent d’agréger et de filtrer les données pour finalement les analyser, tous les aspects seront abordés.
Objectifs de cette formation Big Data - Mise en oeuvre pratique d'une solution complète d'analyse des données
  • Disposer des compétences techniques nécessaires à la mise en oeuvre d’analyses Big Data
  • Comprendre le cadre juridique du stockage et de l'analyse de données
  • Savoir utiliser des outils de collecte opensource
  • Être en mesure de choisir la bonne solution de stockage de données au regard des spécificités d'un projet (OLAP, NoSQL, graph)
  • Explorer la boite à outils technologique que constitue Hadoop et son écosystème et savoir comment utiliser chaque brique (MapReduce, HIVE, SPARK,...)
  • Apprendre à analyser les résultats et comprendre la signification des données extraites
Public
  • Chefs de projet
  • Data Scientists, Data Analysts
  • Développeurs
  • Analystes et statisticien
  • Toute personne en charge de la mise en oeuvre opérationnelle d’un projet Big Data en environnement Hadoop
Pré-requis
  • Il est recommandé d’avoir suivi le module «Big Data - Les fondamentaux de l'analyse des données» (BD540) pour suivre cette formation dans des conditions optimales
  • Être familier des environnement techniques décisionnels traditionnels et connaître les principes de base d'algorithme est vivement recommandé
  • Disposer d'une première approche pratique d'Hadoop est un plus pour suivre cette formation
  • Disposez-vous des compétences nécessaires pour suivre cette formation ? Testez-vous !
Programme détaillé
Avant le présentielAvant le Présentiel
Pour aborder la formation dans les meilleures conditions, retrouvez sur le Learning Hub ib.
  1. un quiz de consolidation des pré-requis
En présentielEn Présentiel

La collecte de données

  • Où et comment collecter des données ?
  • Les sources de données, les API, les fournisseurs, les agrégateurs...
  • Les principaux outils de collecte et de traitement de l’information (ETL)
  • Prise en main de Talend ETL et de Talend Data Preparation (outils libres)
  • Les particularités de la collecte des données semi-structurées et non-structurées

Le stockage les données

  • Les différentes formes de stockage des données : rappel de l’architecture relationnelle de stockage des données transactionnelles (SGBD/R) et multidimensionnelles (OLAP)
  • Les nouvelles formes de stockage des données - compréhension, positionnement et comparaison : Bases orientées clé-valeur, documents, colonnes, graphes
  • Panorama des bases de données NoSQL
  • Prise en main d'une base de données orientée colonne (Hbase)
  • Particularités liées au stockage des données non-structurées
  • Comment transformer des données non structurées en données structurées

L’écosystème Hadoop

  • Présentation des principaux modules de la distribution Apache Hadoop
  • Présentation et comparaison des principales distributions commerciales (Cloudera, Hortonworks...)
  • L’infrastructure matérielle et logicielle nécessaire au fonctionnement d'une distribution Hadoop en local ou dans le Cloud
  • Les concepts de base de l’architecture Hadoop: Data Node, Name Node, Job Tracker, Task Tracker
  • Présentation de HDFS (Système de gestion des fichiers de Hadoop)
  • Prise en main et exercices pratiques dans HDFS
  • Présentation de MapReduce (Outil de traitement de Hadoop)
  • Les commandes exécutées au travers de PIG
  • Utilisation de HIVE pour transformer du SQL en MapReduce

L'analyse de données

  • Requêter les données
  • Analyser et comprendre la signification des données extraites
  • Particularités liées à l’analyse des données non structurées
  • Analyse statistique : notions de base
  • Analyse prédictive : comment transformer des données du passé en prévisions pour le futur
  • Calculer des tendances
  • Développer des programmes simples d’automatisation des analyses (en Python)
  • Machine Learning : les bases de l’apprentissage machine avec Spark
  • Deep Learning : notions de base de l’analyse future automatisée de données non structurées

Mise en oeuvre de projets BigData

  • Automatisation de tâches avec Oozie
  • Mise en production de programmes de Machine Learning
  • L'utilisation des notebooks comme délivrables
  • Traitement du temps réel
  • Gouvernance de données Big Data
Après le présentielAprès le Présentiel
Retrouvez sur le Learning Hub ib :
  1. Un quiz pédagogique pour évaluer vos acquis et approfondir les sujets de votre choix
  2. Des vidéocasts pour revenir sur les points clés de la formation
  3. Des vidéos-tutos pour vous accompagner dans l'utilisation des outils du Big Data
Les plus de cette formation Big Data - Mise en oeuvre pratique d'une solution complète d'analyse des données
  • Une formation très opérationnelle durant laquelle s'alternent les phases d'apports théoriques, d'échanges, de partage d'expériences.
  • Les ateliers s’appuieront sur des cas réels ; les participants extrairont, stockeront et analyseront des données réelles, en provenance de données ouvertes pour réaliser leurs analyses dans un environnement le plus proche possible de la réalité.
  • L’ensemble des ateliers est réalisé sur une plateforme Cloud (Azure, HDInsight,...)
  • Les retours d'expérience et conseils de consultants experts du domaine.

Informations

Dimension Digitale

  • Durée : 4 jours (28h)
  • Tarif : 2 470 € HT
  • Réf. : BD550
  • Option(s)
    • Repas Paris : 92 € HT


Dates des sessions
Session garantie Formation à distance Session accessible à distance Visio
Bon à savoir...




= une réponse possible
= plusieurs réponses possibles

Vous n'avez pas répondu à toutes les questions !
Vous avez % de bonnes réponses, vous pouvez donc suivre cette formation.
Vous avez % de bonnes réponses.
Nous vous invitons à contacter nos Conseillers Formation au 0825 07 6000 afin qu'ils vous orientent vers une formation plus adaptée à vos connaissances.