Fantom Tag

Formation - Big Data - Mise en oeuvre des traitements de flux de données avec Storm

Gérer en temps réel des flux massifs de données

  • Présentiel ou classe à distance
  • Fondamental
PRESENTIEL OU CLASSE A DISTANCE
Référence
BD519

Durée
2 jours (14 heures)

Prix 2023
1 390,00 €  HT
Formation à la demande
Cette thématique vous intéresse ?
Nos experts conçoivent votre formation
sur-mesure !
Les volumes de données à gérer ne cessent de croitre. Les flux de données suivent et amplifient naturellement cette évolution. Les applications et solutions à disposition des utilisateurs se doivent donc d'exploiter dans des délais toujours plus courts des masses d'informations toujours plus importantes pour gagner en efficacité et en pertinence. (Exemple : sur une page web, l'affichage d'informations directement liées aux actions sur le ou les sites consultés quelques secondes auparavant). Storm est une solution qui permet de gérer en temps réel des flux massifs de données et qui répond en cela efficacement aux nouvelles problématiques liées au Big Data. Les participants à cette formation très pratique apprendront à mettre en oeuvre la solution.
Lire la suite
Pour qui ?

A qui s'adresse cette formation ?

Pour qui

  • Chefs de projet, data scientists, développeurs

Prérequis

  • Connaissance d'un langage de programmation comme Java ou Python
Programme

Le programme

1 - Introduction

  • Présentation de Storm : fonctionnalités, architecture, langages supportés
  • Définitions : spout, bolt, topology

2 - Architecture

  • Étude des composants d'un cluster Storm : master node "nimbus" et worker nodes
  • Positionnement par rapport à un cluster Hadoop
  • Le modèle de données
  • Différents types de flux

3 - Premiers pas

  • Configuration d'un environnement de développement
  • Installation d'un cluster Storm
  • Travaux pratiques sur le projet storm-starter

4 - Flux de données

  • Définition du nombre de flux dans un noeud, création de topologies regroupant des flux entre différents noeuds
  • Communication entre flux en JSON, lecture de flux d'origines diverses (JMS, Kafka, ...)

5 - Haute disponibilité

  • Tolérance aux pannes : principe de fiabilisation des master node, workers node, nimbus
  • Garantie de traitement des flux : principe, paramètres
  • TOPOLOGY_MESSAGE_TIMEOUT_SECS, TOPOLOGY_ACKERS
  • Traitements temps réel avec Trident
  • Scalabilité : parallélisme dans un cluster storm, ajouts de noeuds, commande "storm rebalance"
Objectifs

Les objectifs de la formation

  • Disposer des connaissances nécessaires pour configurer un environnement de développement
  • Savoir mettre en oeuvre Storm pour le traitement des flux de données
  • Comprendre comment assurer le traitement de gros volumes de flux de données de façon performante grâce à la mise en oeuvre de la haute disponibilité
Evaluation

Evaluation

  • Cette formation fait l'objet d'une évaluation formative.
Points forts

Les points forts de la formation

  • Les nombreux retours d'expériences de consultants expérimentés permettent d'illustrer les concepts abordés et d'en faciliter la compréhension.
  • Des ateliers et mises en situations qui permettent d'acquérir une première expérience concrète de la mise en oeuvre de Storm.

Qualité des formations

ib Cegos est certifié Iso 9001 et Qualiopi.

Dates et villes

Mise à jour le 08/12/2023
  • 1 390,00 € HT
    Places disponibles
    S'inscrire
    a distance
  • 1 390,00 € HT
    Places disponibles
    S'inscrire
    Paris
    Tour Atlantique / 1 place de la Pyramide La Défense 9
    92800 Puteaux
Formation - Big Data - Mise en oeuvre des traitements de flux de données avec Storm