Fantom Tag

Formation - Hadoop - Hortonworks pour architectes et administrateurs

Mise en oeuvre d'une solution de stockage réparti

  • Présentiel ou classe à distance
  • Fondamental
Dans vos locaux ou à distance
Référence
BD505

Durée
3 jours (21 heures)

Forfait intra - En savoir plus
8 215,00€ HT
(Prix pour un groupe de 12 personnes max)
Formation à la demande
Cette thématique vous intéresse ?
Nos experts conçoivent votre formation
sur-mesure !
Baptisée Hortonworks Data Platform (HDP), la distribution Hadoop proposée par Hortonworks est la seule qui reprend intégralement le projet Open Source Apache Hadoop. Ce choix a su séduire des éditeurs de renom tels que Microsoft ou IBM qui ont intégré HDP à certaines de leurs solutions comme SQL Server 2014 ou IBM InfoSphere. HDP reste toutefois une solution à part entière dont il convient de maitriser les différentes briques pour mettre en oeuvre une solution de stockage réparti. Les administrateurs et exploitants de cluster Hadoop disposeront à l'issue de cette formation de 3 jours de toutes les connaissances nécessaires pour mener à bien leurs missions respectives.
Lire la suite
Pour qui ?

A qui s'adresse cette formation ?

Pour qui

  • Administrateurs systèmes et personnes qui gèrent et maintiennent les clusters Apache Hadoop en production

Prérequis

  • La plate-forme reposant sur une architecture Linux, il est demandé aux participants de savoir naviguer et modifier des fichiers dans cet environnement
  • Une connaissance préliminaire d'Hadoop n'est pas exigée
Programme

Le programme

1 - Introduction

  • Présentation générale d'Hadoop
  • Exemples d'utilisation dans différents secteurs
  • Historique et chiffres clés : Quand parle-t-on de Big Data ?
  • Les possibilités d'implantation de l'infrastructure et les coûts associés

2 - L'écosystème d'Hadoop

  • Le système de fichier HDFS
  • Le paradigme MapReduce et l'utilisation à travers Yarn
  • Le garant des informations : Zookeeper
  • Le système de stockage de la donnée basé sur le socle : HBase
  • La présentation de l'architecture globale : où installer les services ?
  • La définition du dimensionnement pour un cluster Hadoop
  • Les particularités de MapR

3 - Installation du socle d'Hadoop

  • Installation et configuration manuelle pas-à-pas sur plusieurs machines de : HDFS, YARN, Zookeeper, HBase

4 - Manipulation de données dans un cluster Hadoop

  • Architecture, objectif et fonctionnement de Hue, Hive, Pig, Oozie, Sqoop, Flume, Spark
  • Mise en pratique sur les différents outils

5 - Exploitation d'un cluster Hadoop

  • Architecture, objectif et fonctionnement du Manager : MapR Control System
  • Mise en pratique

6 - Concepts d'architecture complexe

  • Architecture en rack : les avantages, fonctionnement et paramétrage du rack awareness
  • Scalabilité et performances : le Namenode Federation
  • High Availability des serveurs maitres
  • Utilisation des snapshots : sauvegarde et restauration
Objectifs

Les objectifs de la formation

  • Apprendre à élaborer une architecture Hadoop
  • Comprendre comment Hadoop Distributed File System (HDFS) et YARN/MapReduce fonctionnent
  • Savoir exploiter et gérer un cluster Hadoop
  • Être en mesure de configurer Hadoop et ses outils
  • Apprendre à mettre en oeuvre un cluster Hadoop
  • Savoir gérer la maintenance des noeuds dans un cluster
  • Apprendre à déplacer et gérer les données dans un cluster
  • Comprendre comment administrer un cluster Hadoop
Evaluation

Evaluation

  • Cette formation fait l'objet d'une évaluation formative.
Points forts

Les points forts de la formation

  • De la théorie à la pratique : les différents points traités pendant la formation sont illustrés par des exercices pratiques permettant la consolidation des acquis.
  • Formation animée par un expert en Big Data.
  • Des aspects théoriques largement complétés de retours d'expériences de la part du consultant.

Qualité des formations

ib Cegos est certifié Iso 9001 et Qualiopi.

Formation - Hadoop - Hortonworks pour architectes et administrateurs