Menu Recherche Panier
(...)
Vous êtes ici : Accueil > Catalogue des formations > Formation Analyse de données en environnement Hadoop
Technique

Formation Analyse de données en environnement Hadoop

Connaître les outils spécifiques au métier de Data Analyst

Comprendre les besoins métier pour livrer aux décideurs des indicateurs fiables et pertinents, tel est le rôle des Data Analysts. Précisément conçu pour leur apprendre à mettre en oeuvre une solution de Big Data en environnement Hadoop, solution émergente pour les traitements Big Data, ce programme reprend le cheminement logique d’un projet d’analyse de données. De la mise en place d’une solution de stockage HDFS permettant d’organiser un très grand volume d’information, à la réalisation de programmes Pig et Hive qui, convertis en tâches MapReduce, permettent d’agréger et de filtrer les données, tous les aspects seront abordés.
Objectifs de cette formation Analyse de données en environnement Hadoop
  • Comprendre ce que sont Hadoop et YARN
  • Connaître les différents outils et les Framework dans un environnement Hadoop 2.0
  • Découvrir comment HDFS Federation fonctionne dans Hadoop 2.0
  • Appréhender MapReduce
  • Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle
  • Comprendre comment exécuter une tâche de MapReduce sur YARN
  • Savoir écrire des requêtes HiveSQL pour manipuler des données
  • Comprendre comment utiliser le HCatalog avec Pig et Hive
Public
  • Analystes de données, Analystes Business Intelligence, Développeurs Business Intelligence, développeurs SAS et tous les autres analystes qui souhaitent en savoir d'avantage sur l'analyse du Big Data dans un cluster Hadoop
Pré-requis
Programme détaillé

1er Partie

  • Comprendre Hadoop 2.0
  • Le Hadoop Distributed File System (HDFS)
  • Introduction aux données dans HDFS
  • MapReduce Framework et YARN

2ème partie

  • Introduction à Pig
  • Programmation Pig avancée
  • Troubleshooting et optimisation avec Pig
  • Résolution des problèmes avec Pig
  • Logging
  • Utiliser l’UI Web d’Hadoop
  • Demo optionnelle : résolution d’un « Failed Job » avec l’UI Web
  • Echantillonnage de données et débugage
  • Vue d’ensemble des performances
  • Comprendre le plan d’exécution
  • Astuces pour améliorer la performance de votre « Pig Jobs »

3ème partie

  • Programmation Hive
  • Utilisation de HCatalog
  • Programmation de Hive avancée
  • Etendre Hive
  • Transformation de données avec des Scripts personnalisés
  • Fonctions définies par l’utilisateur
  • Paramétrer les requêtes
  • Exercices « Hands-On » : transformation de données avec Hive
  • Programmation Hive avancée (Suite)
  • Analyse de données et statistiques
  • Définition workflow avec Oozie
Les plus de cette formation Analyse de données en environnement Hadoop
  • Une pédagogie efficace : l'alternance d'exposés théoriques de démonstrations et de mises en application immédiates à travers de nombreux travaux pratiques.
  • Les retours d’expérience de consultants spécialistes d’Hadoop.

Informations

  • Durée : 3 jours (21h)
  • Tarif : 1 690 € HT
  • Réf. : BD501
  • Option(s)
    • Repas Paris : 69 € HT


Dates des sessions
Session garantie Formation à distance Session accessible à distance Visio
Bon à savoir...


= une réponse possible
= plusieurs réponses possibles

Vous n'avez pas répondu à toutes les questions !
Vous avez % de bonnes réponses, vous pouvez donc suivre cette formation.
Vous avez % de bonnes réponses.
Nous vous invitons à contacter nos Conseillers Formation au 0825 07 6000 afin qu'ils vous orientent vers une formation plus adaptée à vos connaissances.