Best
 
Fantom Tag

Formation - Big Data - Mise en oeuvre pratique d'une solution complète d'analyse des données

Collecte et analyse de données massives

  • Présentiel ou classe à distance
  • Fondamental
  • Blended
PRESENTIEL OU CLASSE A DISTANCE
Durée
4 jours (28 heures)
activités à distance

Prix
2 790,00 €  HT

Référence
BD550
Dans vos locaux ou à distance
Référence
BD550

Durée
4 jours (28 heures)

Forfait intra - En savoir plus
9 885,00€ HT
Prix pour un groupe de 12 personnes max
Formation à la demande
Cette thématique vous intéresse ?
Nos experts conçoivent votre formation
sur-mesure !
Comprendre les besoins métier pour livrer aux décideurs des indicateurs fiables et pertinents, tel est le rôle attendu des spécialistes Big Data. Précisément conçu pour leur apprendre à mettre en oeuvre une solution de Big Data en environnement Hadoop, solution phare pour les traitements Big Data, ce programme reprend le cheminement logique d'un projet d'analyse de données. De leur collecte initiale à la mise en place de solutions de stockage spécifiques permettant d'organiser un très grand volume d'information, à la réalisation de scripts Pig et Hive qui, convertis en tâches MapReduce, permettent d'agréger et de filtrer les données pour finalement les analyser, tous les aspects seront abordés.
Lire la suite
Pour qui ?

A qui s'adresse cette formation ?

Pour qui

  • Chefs de projet
  • Data Scientists, Data Analysts
  • Développeurs
  • Analystes et statisticien
  • Toute personne en charge de la mise en oeuvre opérationnelle d'un projet Big Data en environnement Hadoop

Prérequis

Programme

Le programme

Avant la session
  • un quiz de consolidation des pré-requis
En présentiel / A distance

1 - Introduction

  • Objectifs
  • Schématisation du projet
  • Écosystème et stack technologique
  • Résultats attendus

2 - Ingestion de données massives

  • Description
  • Caractéristiques clés des outils d'ingestion
  • Solutions (packagées, cloud computing et Hadoop)
  • Focus Apache NIFI
  • Focus Apache KAFKA
  • Ingestion de données en streaming NIFI on KAFKA
  • Réalisation d'un workflow NIFI d'ingestion de donnée streaming dans HDFS

3 - Traitement de données Big Data en batch

  • Diagramme de fonctionnement
  • Solutions logicielles associées (MapReduce, Hive, Spark, ...)
  • Big Data Batch scripting
  • Data Warehousing Big Data
  • Création de tables partitionnées, clusterisées et/ou transactionnelles
  • Écriture des scripts d'updates des différentes tables
  • Analytics Big Data

4 - Traitement avancé Big Data : l'apprentissage machine

  • L'écosystème Spark
  • Schéma général de création d'un modèle de ML
  • Création d'un modèle de clusterisation de données
  • Création d'un modèle d'analyse prédictive supervisé
  • Enrichissement d'un DWH avec Spark
  • Sauvegarde d'un modèle d'apprentissage machine
  • Application d'un modèle ML

5 - Stockage de données distribuées

  • Principes des bases de donnes distribuées
  • Solutions (NoSQL, NewSQL)
  • Création d'une base de données distribuée
  • Ingestion de données dans une base de données distribuées
  • Interrogation d'une base de données distribuées

6 - Automatisation de chaîne de traitement Batch

  • L'orchestrateur Oozie
  • Ordonnancement de scripts HIVE
  • Combinaison avec des scripts SPARK
  • Création d'un worklow Oozie complet

7 - Traitement de données massives en flux (streaming)

  • Principe de fonctionnement
  • Solutions logicielles
  • Le prétraitement de données en streaming
  • L'inscription de streams à un Hub Streaming
  • La consommation de streams auprès d'un Hub
  • Le traitement avancé de données en flux (machine learning)

8 - Mise en oeuvre dans une architecture Big Data

  • Les approches standards
  • Réalisation d'une solution complète de traitement de données type Lamda
  • Réalisation d'une solution complète de traitement de données type Kappa
Après la session
  • Un quiz pédagogique pour évaluer vos acquis et approfondir les sujets de votre choix
  • Des vidéocasts pour revenir sur les points clés de la formation
  • Des vidéos-tutos pour vous accompagner dans l'utilisation des outils du Big Data

Evaluation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Objectifs

Les objectifs de la formation

  • Disposer des compétences techniques nécessaires à la mise en oeuvre d'analyses Big Data
  • Comprendre le cadre juridique du stockage et de l'analyse de données
  • Savoir utiliser des outils de collecte Open Source
  • Être en mesure de choisir la bonne solution de stockage de données au regard des spécificités d'un projet (OLAP, NoSQL, graph)
  • Explorer la boite à outils technologique que constitue Hadoop et son écosystème et savoir comment utiliser chaque brique (MapReduce, HIVE, SPARK...)
  • Apprendre à analyser les résultats et comprendre la signification des données extraites
Points forts

Les points forts de la formation

  • Une formation très opérationnelle durant laquelle s'alternent les phases d'apports théoriques, d'échanges, de partage d'expériences.
  • Les participants réalisent sur un cas concret une chaîne de traitement Big Data (Batch et Streaming).
  • Ils travaillent dans un environnement Cloud sur une des distributions Hadoop les plus utilisées.
  • Les contenus digitaux mis à disposition des stagiaires avant et après la formation renforcent l'efficacité pédagogique du programme et garantissent un bénéfice durable de l'action de formation.
  • 87% des participants à cette formation se sont déclarés satisfaits ou très satisfaits au cours des 12 derniers mois.

Qualité des formations

ib Cegos est certifié Iso 9001 et Qualiopi.

Métier accessible : Data Analyst

Vous pouvez trouver plus d'informations sur ce métier dans la Fiche métier de Data Analyst.

Sessions

Mise à jour le 27/07/2024
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Nantes
    Immeuble Atalante 2 / Zac du Moulin Neuf 2, impasse Augustin Fresnel
    44800 St Herblain
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Rouen
    Parc d'Activités Technologiques de la Vatine / Bâtiment Red Cow - 2ème étage 2 ter rue Georges Charpak
    76130 Mont St Aignan
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Aix en Provence
    Pôle d'activités d'Aix-en-Provence / Espace Cezanne 2ème étage 135, rue André Ampère
    13290 Aix-en-Provence
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Tours
    IBIS Style Tours Centre 4 place de la liberté
    37000 Tours
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Toulouse
    Immeuble TEA / Innoparc A 41 Rue de la Découverte, CS 37621
    31675 Labège Cedex
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Strasbourg
    Immeuble l'Avancée 26C, Bd du Président Wilson
    67000 Strasbourg
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Sophia Antipolis
    400 avenue Roumanille BP309 - Sophia Antipolis
    06410 Biot
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Rennes
    ZAC de Saint Sulpice / Immeuble Osiris II 12J, rue du Patis Tatelin
    35000 Rennes
  • 2 790,00 € HT
    Places disponibles
    Session garantie
    Choisir une session
    Paris
    Tour Atlantique / 1 place de la Pyramide La Défense 9
    92800 Puteaux
  • 2 790,00 € HT
    Places disponibles
    Session garantie
    Choisir une session
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Nancy
    IBIS Style Nancy 8 allée de la Genelière
    54180 Houdemont
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Montpellier
    Espace Entreprise GAROSUD 48 rue Claude Balbastre
    34070 Montpellier
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Marseille
    World Trade Center 2 rue Henri Barbusse
    13241 Marseille
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Lyon
    Le 6ème Sens 186, avenue Thiers
    69465 Lyon Cedex 06
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Lille
    Immeuble Le Corbusier 19, avenue Le Corbusier
    59000 Lille
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Grenoble
    Novotel Grenoble Centre 5-7 Place Robert Schuman
    38000 Grenoble
  • 2 790,00 € HT
    Places disponibles
    Choisir une session
    Bordeaux
    9 rue de Condé
    33000 Bordeaux
Formation - Big Data - Mise en oeuvre pratique d'une solution complète d'analyse des données