Formation - IBM BigInsights - Les fondamentaux

Utiliser IBM Open Platform avec Apache Hadoop

  • Présentiel ou classe à distance
  • Fondamental
Télécharger le PDF
PRESENTIEL OU CLASSE A DISTANCE
Référence
BI213

Référence éditeur
DW613G

Durée
3 jours (21 heures)

Prix
2 390,00 €  HT

Formation à la demande
Cette thématique vous intéresse ?
Nos experts conçoivent votre formation
sur-mesure !

Partager cette formation

Pour qui ?

A qui s'adresse cette formation ?

Pour qui

  • Ingénieurs Big Data
  • Data Scientist
  • Développeurs ou programmeurs
  • Administrateurs qui souhaitent en savoir plus sur la plate-forme Open IBM avec Apache Hadoop

Prérequis

  • Aucun, mais une connaissance de Linux est un plus
Programme

Le programme

1 - 1ère partie : Présentation d'IBM BigInsights

    2 - Introduction au Big Data

      3 - Introduction à IBM BigInsights

        4 - IBM BigInsights pour analystes

          5 - IBM BigInsights pour Data Scientist

            6 - IBM BigInsights pour Enterprise Management

              7 - 2ème partie : IBM Open Platform (IOP) avec Apache Hadoop

                8 - IBM Open Platform avec Apache Hadoop

                  9 - Apache Ambari

                    10 - Système de fichiers distribué Hadoop

                      11 - MapReduce et Yarn

                      • Introduction à MapReduce basé sur MR1
                      • Limites de MR1
                      • YARN et MR2

                      12 - Apache Spark

                        13 - Coordination, gestion et gouvernance

                          14 - Mouvement de données

                            15 - Stockage et accès aux données

                            • Représentation des données : CSV, XML, JSON et YAML
                            • Langages de programmation Open Source: Pig, Hive et autres [R, Python, etc.]
                            • Concepts NoSQL
                            • Accéder aux données Hadoop à l'aide de Hive
                            • Interrogation des données Hadoop à l'aide de Hive

                            16 - Sujets avancés

                            • Contrôle des flux de travaux avec Oozie
                            • Recherche avec Apache Solr
                            Objectifs

                            Les objectifs de la formation

                            • Comprendre le but du Big Data et comprendre pourquoi c'est important
                            • Pouvoir énumérer les sources de données (données au repos ou données en mouvement)
                            • Décrire l'offre IBM BigInsights
                            • Apprendre à utiliser les divers outils IBM BigInsights, notamment Big SQL, BigSheets, Big R, Jaql et AQL pour vos besoins de données volumineuses
                            • Être capable d'énumérer et de décrire les principaux composants de la pile Apache Hadoop Open Source et l'approche adoptée par Open Data Foundation
                            • Savoir gérer et surveiller les clusters Hadoop avec Apache Ambari et les composants associés
                            • Pouvoir explorer le système de fichiers distribués Hadoop (HDFS) en exécutant les commandes Hadoop
                            • Être en mesure de comprendre les différences entre Hadoop 1 (avec MapReduce 1) et Hadoop 2 (avec YARN et MapReduce 2)
                            • Comprendre comment créer et exécuter des travaux MapReduce de base à l'aide de la ligne de commande
                            • Pouvoir expliquer comment Spark s'intègre dans l'écosystème Hadoop
                            • Apprendre à exécuter des algorithmes itératifs en utilisant le RDD de Spark
                            • Connaître les méthodes courantes pour effectuer le transfert de données
                            • Savoir déplacer des données dans le système HDFS à partir de bases de données relationnelles à l'aide de Sqoop
                            • Comprendre quand utiliser différents formats de stockage de données (fichiers à plat, fichiers CSV / délimités, fichiers Avro / Sequence, Parquet, etc.)
                            • Passer en revue les différences entre les langages de programmation Open Source disponibles généralement utilisés avec Hadoop (Pig, Hive) et pour Data Science (Python, R)
                            Points forts

                            Les points forts de la formation

                            • Cette formation comprend deux modules distincts. Le premier module, "IBM BigInsights Overview", vous donnera un aperçu de la stratégie IBM en matière de données volumineuses, ainsi que des raisons pour lesquelles il est important de comprendre et d'utiliser les données volumineuses. Le deuxième module s'intitule "IBM Open Platform avec Apache Hadoop". IBM Open Platform (IOP) avec Apache Hadoop est la première plate-forme collaborative permettant aux solutions Big Data d'être développées sur le même ensemble de technologies Apache Hadoop.
                            • Une pédagogie efficace : l'alternance d'exposés théoriques et de mises en application immédiates à travers de nombreux travaux pratiques.
                            • Les consultants spécialistes de la technologie apportent leurs conseils et leur expérience.
                            • La qualité d'une formation officielle IBM (support de cours numérique en anglais).

                            Qualité des formations

                            ib - groupe Cegos est certifié Iso 9001 et Qualiopi.

                            Dates et villes

                            Mise à jour le 03/10/2022

                            Trier par:

                            • 2 390,00 € HT
                              Places disponibles
                              S'inscrire
                              Le lieu de formation sera indiqué environ 3 semaines avant le début de la formation
                            Formation - IBM BigInsights - Les fondamentaux