Menu Recherche Panier
(...)
Vous êtes ici : Accueil > Catalogue des formations > Formation IBM InfoSphere DataStage PX v11.5 - Essentials
Technique

Formation IBM InfoSphere DataStage PX v11.5 - Essentials

Mise en oeuvre d’un projet d’ETL

ETL (Extract-Transform-Load) proposé par IBM, InfoSphere DataStage est une solution d'importation, de manipulation et de mappages de données complexes et hétérogènes. Sa mise en oeuvre permet d'effectuer des synchronisations massives d'informations d'une base de données vers une autre et d'alimenter ainsi des Data Warehouses. Les participants à cette formation très pratique apprendront à utiliser DataStage pour construire et exécuter des jobs d'extraction, de transformation et de chargements (ETL).
Objectifs de cette formation IBM InfoSphere DataStage PX v11.5 - Essentials
  • Comprendre comment combiner les données en utilisant les instructions Lookup, Join et Merge
  • Savoir transformer, combiner, filtrer et trier des données à l'aide de travaux (jobs)
  • Être en mesure de construire des agrégats de données
  • Maîtriser la création de rapports avec des travaux (jobs)
  • Être en mesure de construire des agrégats de données
Public
  • Chefs de projets et développeurs ETL responsables des extractions et transformations des données en utilisant DataStage
Pré-requis
Programme détaillé

Introduction à DataStage

  • Lister et décrire les utilisations de DataStage
  • Lister et décrire les clients DataStage
  • Décrire le Workflow DataStage
  • Décrire les deux types de parallélisme possibles avec les tâches en parallèle dans DataStage

Déploiement

  • Identifier les composants de Information Server qui doivent être installés
  • Décrire en quoi consiste un déploiement
  • Décrire les différentes options de déploiement du domaine
  • Décrire le processus d’installation
  • Démarrer Information Server

Administration DataStage

  • Ouvrir la console Web
  • Créer des nouveaux utilisateurs et des groupes
  • Assigner des rôles
  • Suite et composant aux utilisateurs et aux groupes
  • Donner les accès DataStage aux utilisateurs
  • Connexion à DataStage en tant qu’administrateur
  • Ajouter un utilisateur DataStage dans l’onglet Permission et spécifier le rôle de l’utilisateur
  • Spécifier les projets par défaut
  • Lister et décrire les variables d’environnement importantes

Travailler avec les métadonnées

  • Connexion à DataStage
  • Se déplacer dans DataStage Designer
  • Importer et exporter les objets DataStage dans un fichier
  • Importer une définition de table pour un fichier séquentiel

Créer des tâches parallèles

  • Concevoir des tâches parallèles dans DataStage
  • Définir le paramètre de la tâche
  • Utiliser Row Generator, Peek et Annotation dans une tâche
  • Compiler les tâches
  • Activer les tâches
  • Surveiller les journaux des tâches
  • Créer un jeu de paramètres et l’utiliser dans une tâche

Accéder aux données séquentielles

  • Comprendre les étapes pour accéder aux différents types de fichiers de données
  • Lire et écrire des séquences de fichiers via Sequential File Stage
  • Lire et écrire des fichiers d’ensemble de données via les étapes DataStage
  • Créer des liens de rejet
  • Travailler avec les valeurs NULL dans les fichiers séquentiels
  • Lire des fichiers séquentiels multiples via des modèles de fichiers
  • Utiliser des lecteurs multiples

Partitionner et collecter

  • Décrire l’architecture du processus parallèle
  • Décrire le pipeline et la partition du parallélisme
  • Lister et décrire le partitionnement et les algorithmes de rassemblage
  • Décrire les fichiers de configuration
  • Décrire le processus de compilation des tâches parallèles
  • Expliquer OSH

Combiner les données

  • Combiner les données via les étapes Lookup
  • Définir les "range lookups"
  • Combiner les données via la fusion
  • Combiner les données via la jointure
  • Combiner les données via Funnel

Étape de traitement de groupe

  • Trier les données
  • Combiner l’étape d’agrégation
  • Combiner les données et supprimer les doublons

Étape de la transformation

  • Utilise l’étape de transformation dans les tâches parallèles
  • Définir les contraintes
  • Définir les dérivations
  • Utiliser les variables
  • Créer un jeu de paramètres et utiliser ses paramètres dans les contraintes et les dérivations

Fonctions Repository

  • Améliorer la recherche simple
  • Améliorer la recherche avancée
  • Améliorer l’analyse d’impact
  • Comparer les différences entre deux définitions de table
  • Comparer les différences entre deux tâches

Travailler avec des données relationnelles

  • Importer les définitions de tables pour les tables relationnelles
  • Créer les connexions de données
  • Utiliser ODBC et le connecteur DB2 dans une tâche
  • Utiliser SQL Builder pour définir SQL SELECT et INSERT
  • Utiliser les liens d’entrée multiples dans le connecteur pour mettre à jour les tables multiples dans une transaction simple
  • Créer des liens de rejets à partir du Connecteur pour capturer les lignes avec les erreurs SQL

Contrôler les tâches

  • Utiliser le séquenceur de tâches DataStage pour créer une tâche qui contrôle une séquence de tâches
  • Utiliser les liens du séquenceur et les étapes pour contrôler la séquence d’un jeu de tâches
  • Utiliser les déclencheurs et les étapes pour contrôler les conditions selon lesquelles les tâches sont activées
  • Transmettre des informations dans les paramètres des tâches à partir du master de contrôle des tâches
  • Prise en main des erreurs et des exceptions
Les plus de cette formation IBM InfoSphere DataStage PX v11.5 - Essentials
  • Les apports théoriques sont très largement complétés par des phases de mise en pratique qui amènent les participants à réaliser de nombreuses manipulations.
  • Des consultants expérimentés partagent leur savoir-faire avec les participants.
  • La qualité d'une formation officielle IBM (remarque : support de cours en anglais).
Certification

Cette formation prépare au test suivant :

  • C2090-424
et entre en jeu dans le cursus de certification :
  • IBM Certified Solution Developer - InfoSphere DataStage

Informations

  • Durée : 4 jours (28h)
  • Tarif : 2 970 € HT
  • Réf. : BI202
  • Réf. éditeur : KM204G


Dates des sessions
Session garantie Formation à distance Session accessible à distance Visio
Bon à savoir...




= une réponse possible
= plusieurs réponses possibles

Vous n'avez pas répondu à toutes les questions !
Vous avez % de bonnes réponses, vous pouvez donc suivre cette formation.
Vous avez % de bonnes réponses.
Nous vous invitons à contacter nos Conseillers Formation au 0825 07 6000 afin qu'ils vous orientent vers une formation plus adaptée à vos connaissances.