Fantom Tag

Formation - Amazon Web Services (AWS) - Big Data

Concevoir des solutions Big Data avec AWS

  • Présentiel ou classe à distance
PRESENTIEL OU CLASSE A DISTANCE
Référence
CC321

Durée
3 jours (21 heures)

Prix 2023
2 440,00 €  HT
Formation à la demande
Cette thématique vous intéresse ?
Nos experts conçoivent votre formation
sur-mesure !
Comment mettre en oeuvre des solutions Big Data sur AWS ? Les nombreux outils intégrés à AWS tels que Amazon Elastic MapReduce (EMR), Amazon Redshift, Amazon Kinesis entre autres permettent de concevoir des solutions d’analyse de premier ordre. Cette formation permet aux participants d’apprendre à utiliser Amazon EMR pour traiter des données à l'aide du vaste écosystème d'outils Hadoop tels que Hive et Hue. Ils découvriront également comment créer des environnements Big Data, utiliser Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena et Amazon Kinesis, et à tirer parti des meilleures pratiques pour concevoir des environnements Big Data sécurisés et performants.
Cette formation prépare à la certification AWS Certified Data Analytics - Specialty.
Lire la suite
Pour qui ?

A qui s'adresse cette formation ?

Pour qui

  • Personnes responsables de la conception et de la mise en oeuvre de solutions Big Data, à savoir les architectes de solutions et les administrateurs SysOps
  • Scientifiques et analystes de données intéressés par les solutions Big Data sur AWS

Prérequis

  • Connaissances de base sur les technologies Big Data, notamment Apache Hadoop, HDFS et les requêtes SQL/NoSQL
  • Avoir suivi une formation en ligne sur les fondamentaux de l'analyse des données ou une expérience équivalente
  • Connaissance pratique des services AWS de base et de la mise en oeuvre du Cloud public
  • Avoir suivi la formation "Amazon Web Services (AWS) - Fondamentaux techniques" (CC311) ou connaissances équivalentes
  • Compréhension de base de l'entreposage de données, des systèmes de bases de données relationnelles et de la conception de bases de données
Programme

Le programme

1 - Présentation du Big Data

  • Qu'est-ce que le Big Data
  • Le pipeline de Big Data
  • Principes architecturaux du Big Data

2 - Ingestion et transfert de Big Data

  • Présentation : ingestion de données
  • Transfert de données

3 - Streaming de Big Data et Amazon Kinesis

  • Traitement de flux de données volumineuses
  • Amazon Kinésis
  • Amazon Kinesis Data Firehose
  • Flux vidéo Amazon Kinesis
  • Analyse de données Amazon Kinesis
  • Lab : diffusion et traitement des journaux du serveur Apache à l'aide d'Amazon Kinesis

4 - Solutions de stockage de Big Data

  • Options de stockage de données AWS
  • Concepts de solutions de stockage
  • Facteurs dans le choix d'un magasin de données

5 - Traitement et analyse Big Data

  • Traitement et analyse Big Data
  • Amazon Athéna
  • Lab : utilisation d'Amazon Athena pour analyser les données de journal

6 - Apache Hadoop et Amazon EMR

  • Introduction à Amazon EMR et Apache Hadoop
  • Meilleures pratiques pour l'ingestion de données
  • Amazon DME
  • Architecture Amazon EMR
  • Lab : stockage et interrogation de données sur Amazon DynamoDB

7 - Utilisation d'Amazon EMR

  • Développer et exécuter votre application
  • Lancement de votre cluster
  • Gestion de la sortie de vos travaux terminés

8 - Frameworks de programmation Hadoop

  • Cadres Hadoop
  • Autres frameworks à utiliser sur Amazon EMR
  • Lab : traitement des journaux de serveur avec Hive sur Amazon EMR

9 - Interfaces Web sur Amazon EMR

  • Hue sur Amazon EMR
  • Surveillance de votre cluster
  • Lab : exécution de scripts Pig dans Hue sur Amazon EMR

10 - Apache Spark sur Amazon EMR

  • Apache Spark
  • Utilisation de Spark
  • Lab : traiter les données de NY Taxi à l'aide d'Apache Spark

11 - Utilisation d'AWS Glue pour automatiser les charges de travail ETL

  • Qu'est-ce qu'AWS Glue ?
  • AWS Glue : orchestration des tâches

12 - Amazon Redshift et le Big Data

  • Entrepôts de données vs bases de données traditionnelles
  • Amazon Redshift
  • Architecture Amazon Redshift

13 - Sécuriser vos déploiements Amazon

  • Sécuriser vos déploiements Amazon
  • Présentation de la sécurité Amazon EMR
  • Présentation d'AWS Identity and Access Management (IAM)
  • Sécurisation des données
  • Présentation de la sécurité Amazon Kinesis
  • Présentation de la sécurité Amazon DynamoDB
  • Présentation de la sécurité Amazon Redshift

14 - Gérer les coûts du Big Data

  • Considérations relatives au coût total pour Amazon EMR
  • Modèles de tarification Amazon EC2
  • Modèles de tarification Amazon Kinesis
  • Considérations relatives aux coûts pour Amazon DynamoDB
  • Considérations relatives aux coûts et modèles de tarification pour Amazon Redshift
  • Optimisation des coûts avec AWS

15 - Visualiser et orchestrer le Big Data

  • Visualisation du Big Data
  • Amazon QuickSight
  • Orchestrer un workflow big data
  • Lab : utilisation de TIBCO Spotfire pour visualiser les données

16 - Modèles de conception Big Data

  • Architectures communes

17 - Conclusion

    Objectifs

    Les objectifs de la formation

    • Apprendre à utiliser Apache Hadoop avec Amazon EMR
    • Savoir lancer et configurer un cluster Amazon EMR
    • Comprendre comment utiliser des frameworks de programmation communs pour Amazon EMR, y compris Hive, Pig et Streaming
    • Être capable d'utiliser Hue pour améliorer la facilité d'utilisation d'Amazon EMR
    • Pouvoir utiliser les analyses en mémoire avec Spark sur Amazon EMR
    • Comprendre comment des services comme AWS Glue, Amazon Kinesis, Amazon Redshift, Amazon Athena et Amazon QuickSight peuvent être utilisés avec des charges de travail Big Data
    Evaluation

    Evaluation

    • Cette formation fait l'objet d'une évaluation formative.
    Points forts

    Les points forts de la formation

    • Cette formation permet aux participants de tester de nouvelles compétences et d’appliquer des connaissances à leur environnement de travail par le biais d’une variété d’exercices pratiques.
    • Des consultants formateurs experts : les instructeurs sont certifiés pédagogiquement par Amazon Web Services, et disposent de la certification requise du niveau concerné par la formation.
    • La qualité d'une formation officielle AWS (support de cours numérique en anglais).

    Qualité des formations

    ib Cegos est certifié Iso 9001 et Qualiopi.

    Dates et villes

    Mise à jour le 30/11/2023
      Formation - Amazon Web Services (AWS) - Big Data