Spécifiquement conçue par de nombreux contributeurs et notamment par des instituts français d'enseignement supérieurs et de recherche tels que l'INRIA et Télécom Paritech, SciKit-Learn est une bibliothèque libre développée en Python et destinée à la mise en oeuvre de solutions d'apprentissage automatique. Simple d'utilisation et polyvalente, SciKit-Learn peut être utilisée dans une grande variété de projets : ciblages marketing, prévisions de comportements d'internautes, optimisation de processus industriels ou logistiques... Les participants à cette formation de 2 jours acquerront les compétences et connaissances nécessaires à la mise en oeuvre de SciKit-Learn dans leurs projets.
Objectifs de cette formation
L'apprentissage Machine en Python (SciKit-Learn) - Être capable de mettre en oeuvre SciKit-learn pour de l'apprentissage machine et l'analyse de données
- Comprendre comment collecter les données et les préparer pour un traitement efficient
- Savoir modéliser les données et optimiser les modèles
- Être en mesure d'industrialiser et de déployer une application de prédiction
- Chefs de projet et data-scientists souhaitant comprendre le fonctionnement de SciKit-learn
L'écosystème SciKit Learn
- Origine
- Missions et évolutions
- Architecture
- Modules
- Atelier pratique : Installation de l'écosystème (PC, MAC, LINUX)
Bonnes pratiques SciKit Learn : la récupération de données
- L'API dédiée aux jeux de données
- Problématique des grands jeux de données
- Les jeux de données internes au framework
- La génération de données artificielles
- L'accès aux données ouvertes
- Méthodologies de chargement de données externes
- Atelier pratique : Collecte de données sur un cas concret
Bonnes pratiques SciKit Learn : le prétraitement
- Cadre et rôle du prétraitement
- Méthodes de mise à l'échelle des données
- Normalisation des données
- Traitement des données catégorielles
- Traitement des données manquantes
- Atelier pratique : Prétraitement des données dans un cas concret
Bonnes pratiques SciKit Learn : l'ingénierie des variables prédictives
- Cadre et rôle de l'ingénierie des variables prédictives
- Transformations non linéaires
- Algorithmes de réduction dimensionnelle de données
- L'extraction automatique de traits (textes, images)
- Combinaison et transformations ad-hoc des données
- Atelier pratique : Ingénierie des variables prédictives sur un cas concret
Bonnes pratiques SciKit Learn : la modélisation
- Cartographie des algorithmes de l'écosystème
- Tour de l'apprentissage supervisé avec SciKit Learn
- Tour de l'apprentissage non supervisé avec SciKit Learn
- En pratique, mode de sélection d'algorithmes pertinents
- Atelier pratique : L'apprentissage supervisé et non supervisé sur cas concrets
Bonnes pratiques SciKit Learn : sélection et optimisation des modèles
- Présentation et usage des outils de combinaison et de chaînage de processus
- L'évaluation de performance par validation-croisée
- Le réglage des hyper-paramètres d'un modèle
- Les APIs d'évaluation des modèles de prédiction
- Les différentes courbes d'évaluations de modèles de prédictions
- Atelier pratique : Sélection de modèle, et optimisation des réglages
Bonnes pratiques SciKit Learn : industrialisation et déploiement
- Persistance des modèles
- Scaling des applications de prédictions avec SciKit Learn
- Problématiques de latence et de débit à l'exécution
- La parallélisation
- La gestion de l'environnement Python associé
- Atelier pratique : Industrialisation d'une application de prédiction
Les plus de cette formation
L'apprentissage Machine en Python (SciKit-Learn) - Un tour d'horizon complet des fonctionnalités de SciKit-Learn
- Une formation très opérationnelle durant laquelle s'alternent les phases d'apports théoriques, d'échanges, de partage d'expériences et les séquences de mise en pratique
- Une formation pratique : chaque point abordé fera l'objet de manipulations à travers des ateliers pratiques
- Les retours d'expérience et conseils de consultants experts.