PRESENTIEL OU CLASSE A DISTANCE

Durée

3 jours (21 heures)

Prix

2 350,00 € HT

Référence

BI105

Consulter les dates et villes

Choisir une session

Dans vos locaux ou à distance

Durée

3 jours (21 heures)

Forfait intra - En savoir plus

7 590,00€ HT

Prix pour un groupe de 12 personnes max

Référence

BI105

Demander un devis

Formation à la demande

Cette thématique vous intéresse ?
Nos experts conçoivent votre formation
sur-mesure !

Nous contacter

Télécharger le PDF

Ajouter à ma sélection

Nous contacter

La maitrise du Data Mining et du Machine Learning est devenue une compétence nécessaire, voire même indispensable à toute personne souhaitant développer une expertise Big Data puisqu'elle permet d'explorer ou de fouiller de très importants volumes de données pour construire des modèles et répondre aux problèmes très variés des entreprises et organisations lorsque les méthodes statistiques traditionnelles deviennent inopérantes. Pour cela, les experts en Big Data doivent maitriser l'élaboration et l'étude des algorithmes permettant à des machines d'apprendre automatiquement à partir des données et à effectuer des tâches de façon autonome pour modéliser des tendances.

Pour qui ?

A qui s'adresse cette formation ?

Pour qui

Ingénieurs, analystes, responsables marketing
Data Analysts, Data Scientists, Data Steward
Toute personne intéressée par les techniques de Data Mining et de Machine Learning

Prérequis

Connaître l'utilité du Data Mining et les problématiques du Big Data dans le ciblage économique
Disposez-vous des connaissances nécessaires pour suivre cette formation ? Testez-vous !

Programme

Le programme

1 - L'apprentissage machine (Introduction)

Introduction
Champs de compétences
Focus Data Science (Data Mining)
Focus Machine Learning
Focus Big Data
Focus Deep Learning
Définition de l'apprentissage machine
Exemples de tâches du machine Learning
Que peuvent apprendre les machines
Les différents modes d'entraînement

2 - Les fondamentaux de l'apprentissage machine

Préambule : - Un problème d'optimisation - Quête de la capacité optimale du modèle - Relation capacité et erreurs - Un apport philosophique - Cadre statistique - Anatomie d'un modèle d'apprentissage machine
Jeux de données d'entraînement : - Cadre statistique - Les variables prédictives - Chaîne de traitement des variables prédictives - Les variables à prédire
Fonctions hypothèses : - Principe : jeux de fonctions hypothèses - Contexte de sélection des fonctions hypothèses - Caractéristiques des fonctions hypothèses - Modèles probabilistes Fréquentistes et Bayésiens
Fonctions de coûts : - Les estimateurs - Principe du maximum de vraisemblance (MLE*) - MAP - Maximum A Posteriori - Le biais d'un estimateur - La variance d'un estimateur - Le compromis biais - variance - Les fonctions de coûts - La régularisation des paramètres
Algorithmes d'optimisations : - Les grandes classes d'algorithmes d'optimisation - La descente de gradient (1er ordre) - Descente de gradient (détails) - Les approches de Newton (2nd ordre) - Optimisation batch et stochastique - Pour aller plus loin
Lab : Mise en oeuvre de l'environnement de travail machine Learning

3 - La classification

Introduction : - Choisir un algorithme de classification
La régression logistique : - Du Perceptron à la régression logistique - Hypothèses du modèle - Apprentissage des poids du modèle - Exemple d'implémentation : scikit-learn - Régression logistique - Fiche Synthèse
SVM : - Classification à marge maximum - La notion de marge souple (soft margin) - Les machines à noyau (kernel machines) - L'astuce du noyau (kernel trick) - Les fonctions noyaux - SVM - Maths - SVM - Fiche Synthèse
Arbres de décision : - Principe de base - Fonctionnement - Maximisation du Gain Informationnel - Mesure d'impureté d'un noeud - Exemple d'implémentation : scikit-learn -Arbres de décision - Fiche Synthèse
K plus proches voisins (kNN) : - L'apprentissage à base d'exemples - Principe de fonctionnement - Avantages et désavantages - kNN - Fiche synthèse
Synthèse
Lab : Expérimentation des algorithmes de classification sur cas concrets

4 - Les pratiques

Prétraitement : - Gestion des données manquantes - Transformateurs et estimateurs - Le traitement des données catégorielles - Le partitionnement des jeux de données - Mise à l'échelle des données
Ingénierie des variables prédictives (Feature Engineering) : - Sélection des variables prédictives - Sélection induite par régularisation L1 - Sélection séquentielle des variables - Déterminer l'importance des variables - Réduction dimensionnelle par Compression des données - L'extraction de variables prédictives - Analyse en composante principale (ACP) - Analyse linéaire discriminante (ADL) - l'ACP à noyau (KPCA)
Réglages des hyper-paramètres et évaluation des modèles : - Bonnes pratiques - La notion de Pipeline - La validation croisée (cross validation) - Courbes d'apprentissage - Courbes de validation - La recherche par grille (grid search) - Validation croisée imbriquée (grid searchcv) - Métriques de performance
Synthèse
Lab : Expérimentation des pratiques du machine learning sur cas concrets

5 - L'apprentissage d'ensembles (ensemble learning)

Introduction
L'approche par vote
Une variante : l'empilement (stacking)
Le bagging
Les forêts aléatoires
Le boosting
La variante Adaboost
Gradient Boosting
Fiches synthèses
Lab : L'apprentissage d'ensemble sur un cas concret

6 - La régression

Régression linéaire simple
Régression linéaire multi-variée
Relations entre les variables
Valeurs aberrantes (RANSAC)
Évaluation de la performance des modèles de régression
La régularisation des modèles de régression linéaire
Régression polynomiale
La régression avec les forêts aléatoires
Synthèse
Lab : La régression sur un cas concret

7 - Le clustering

Introduction
Le regroupement d'objets par similarité avec les k-moyens (k-means)
k-means : algorithme
L'inertie d'un cluster
Variante k-means ++
Le clustering flou
Trouver le nombre optimal de clusters avec la méthode Elbow
Appréhender la qualité des clusters avec la méthode des silhouettes
Le clustering hiérarchique
Le clustering par mesure de densité DBSCAN
Autres approches du Clustering
Synthèse
Lab : Le clustering sur un cas concret

Evaluation

Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.

Objectifs

Les objectifs de la formation

Comprendre les différences entre apprentissage automatique supervisé, non supervisé et méta-apprentissage
Savoir transformer un gros volume de données à priori hétérogènes en informations utiles
Maîtriser l'utilisation d'algorithmes d'auto-apprentissage adaptés à une solution d'analyse
Comprendre comment exploiter de gros volumes de données textuelles
Être capable d'appliquer ces différentes techniques aux projets Big Data

Evaluation

Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.

Points forts

Les points forts de la formation

Une formation très pratique : 70% du temps de la formation est dédié à la mise en pratique pour une meilleure assimilation de notions de base.
Cette formation est basée sur des exercices principalement proposés par le formateur et tirés de l'ouvrage qui sert de support pour la formation.
Les travaux pratiques sont principalement réalisés avec R et Python.
Des consultants expérimentés partagent leur savoir-faire avec les participants.
96% des participants à cette formation se sont déclarés satisfaits ou très satisfaits au cours des 12 derniers mois.

Qualité des formations

ib Cegos est certifié Iso 9001 et Qualiopi.

En savoir plus

Reviews

Les avis de nos clients sur la formation

5,0

100%

...Loading

Sessions

Mise à jour le 30/06/2025

2 350,00 € HT
Places disponibles
S'inscrire
Metz
Mercure Metz Centre 29 pl Saint-Thiï¿½bault
57100 Metz
2 350,00 € HT
Places disponibles
S'inscrire
Strasbourg
Immeuble l'Avancee 26C, Bd du President Wilson
67000 Strasbourg
2 350,00 € HT
Places disponibles
S'inscrire
Saint-Etienne
Le Point Milieu 20 rue de la Presse
42000 Saint-Etienne
2 350,00 € HT
Places disponibles
S'inscrire
Rouen
Parc d'Activites Technologiques de la Vatine / Betiment Red Cow - 2eme etage 2 ter rue Georges Charpak
76130 Mont St Aignan
2 350,00 € HT
Places disponibles
S'inscrire
Rennes
ZAC de Saint Sulpice / Immeuble Osiris II 12J, rue du Patis Tatelin
35000 Rennes
2 350,00 € HT
Places disponibles
S'inscrire
Nantes
Immeuble Atalante 2 / Zac du Moulin Neuf 2, impasse Augustin Fresnel
44800 St Herblain
2 350,00 € HT
Places disponibles
S'inscrire
Nancy
IBIS Style Nancy 8 allee de la Geneliere
54180 Houdemont
2 350,00 € HT
Places disponibles
S'inscrire
Montpellier
Espace Entreprise GAROSUD 48 rue Claude Balbastre
34070 Montpellier
2 350,00 € HT
Places disponibles
S'inscrire
Toulouse
Immeuble TEA / Innoparc A 41 Rue de la Decouverte, CS 37621
31675 Labege Cedex
2 350,00 € HT
Places disponibles
S'inscrire
Lyon
Le 6me Sens 186, avenue Thiers
69465 Lyon Cedex 06
2 350,00 € HT
Places disponibles
S'inscrire
Tours
IBIS Style Tours Centre 4 place de la liberte
37000 Tours
2 350,00 € HT
Places disponibles
S'inscrire
Lille
Immeuble Le Corbusier 19, avenue Le Corbusier
59000 Lille
2 350,00 € HT
Places disponibles
S'inscrire
Grenoble
Novotel Grenoble Centre 5-7 Place Robert Schuman
38000 Grenoble
2 350,00 € HT
Places disponibles
S'inscrire
2 350,00 € HT
Places disponibles
S'inscrire
Bordeaux
9 rue de Conde
33000 Bordeaux
2 350,00 € HT
Places disponibles
S'inscrire
Angers
Novotel Angers Centre Gare 1 rue Auguste Gautier
49100 Angers
2 350,00 € HT
Places disponibles
S'inscrire
Tours
IBIS Style Tours Centre 4 place de la liberte
37000 Tours
2 350,00 € HT
Places disponibles
S'inscrire
2 350,00 € HT
Places disponibles
S'inscrire
Sophia Antipolis
400 avenue Roumanille BP309 - Sophia Antipolis
06410 Biot
2 350,00 € HT
Places disponibles
S'inscrire
Rouen
Parc d'Activites Technologiques de la Vatine / Betiment Red Cow - 2eme etage 2 ter rue Georges Charpak
76130 Mont St Aignan
2 350,00 € HT
Places disponibles
S'inscrire
Aix en Provence
Pele d'activites d'Aix-en-Provence / Espace Cezanne 2eme etage 135, rue Andre Ampere
13290 Aix-en-Provence
2 350,00 € HT
Places disponibles
S'inscrire
Toulon
Best Western Plus Hï¿½tel La Corniche 17 Littoral Frï¿½dï¿½ric Mistral
83000 Toulon
2 350,00 € HT
Places disponibles
S'inscrire
Paris
Tour Atlantique / 1 place de la Pyramide La Defense 9
92800 Puteaux
2 350,00 € HT
Places disponibles
S'inscrire
Marseille
World Trade Center 2 rue Henri Barbusse
13241 Marseille
2 350,00 € HT
Places disponibles
S'inscrire
Lille
Immeuble Le Corbusier 19, avenue Le Corbusier
59000 Lille
2 350,00 € HT
Places disponibles
S'inscrire
Montpellier
Espace Entreprise GAROSUD 48 rue Claude Balbastre
34070 Montpellier
2 350,00 € HT
Places disponibles
S'inscrire
Grenoble
Novotel Grenoble Centre 5-7 Place Robert Schuman
38000 Grenoble
2 350,00 € HT
Places disponibles
S'inscrire
Nantes
Immeuble Atalante 2 / Zac du Moulin Neuf 2, impasse Augustin Fresnel
44800 St Herblain
2 350,00 € HT
Places disponibles
S'inscrire
Angers
Novotel Angers Centre Gare 1 rue Auguste Gautier
49100 Angers
2 350,00 € HT
Places disponibles
Session garantie
Cette session ne sera ni annulée, ni reportée, sauf cas de force majeure ou raisons pédagogiques. Nous vous proposerons alors de reporter l'inscription sur la ville la plus proche, ou à distance.
S'inscrire
Paris
Tour Atlantique / 1 place de la Pyramide La Defense 9
92800 Puteaux
2 350,00 € HT
Places disponibles
S'inscrire
Toulouse
Immeuble TEA / Innoparc A 41 Rue de la Decouverte, CS 37621
31675 Labege Cedex
2 350,00 € HT
Places disponibles
S'inscrire
Rennes
ZAC de Saint Sulpice / Immeuble Osiris II 12J, rue du Patis Tatelin
35000 Rennes
2 350,00 € HT
Places disponibles
S'inscrire
Lyon
Le 6me Sens 186, avenue Thiers
69465 Lyon Cedex 06
2 350,00 € HT
Places disponibles
Session garantie
Cette session ne sera ni annulée, ni reportée, sauf cas de force majeure ou raisons pédagogiques. Nous vous proposerons alors de reporter l'inscription sur la ville la plus proche, ou à distance.
S'inscrire
2 350,00 € HT
Places disponibles
S'inscrire
Saint-Etienne
Le Point Milieu 20 rue de la Presse
42000 Saint-Etienne
2 350,00 € HT
Places disponibles
S'inscrire
Bordeaux
9 rue de Conde
33000 Bordeaux
2 350,00 € HT
Places disponibles
S'inscrire
Toulon
Best Western Plus Hï¿½tel La Corniche 17 Littoral Frï¿½dï¿½ric Mistral
83000 Toulon
2 350,00 € HT
Places disponibles
S'inscrire
Tours
IBIS Style Tours Centre 4 place de la liberte
37000 Tours
2 350,00 € HT
Places disponibles
S'inscrire
Strasbourg
Immeuble l'Avancee 26C, Bd du President Wilson
67000 Strasbourg
2 350,00 € HT
Places disponibles
S'inscrire
Sophia Antipolis
400 avenue Roumanille BP309 - Sophia Antipolis
06410 Biot
2 350,00 € HT
Places disponibles
S'inscrire
Rouen
Parc d'Activites Technologiques de la Vatine / Betiment Red Cow - 2eme etage 2 ter rue Georges Charpak
76130 Mont St Aignan
2 350,00 € HT
Places disponibles
S'inscrire
Paris
Tour Atlantique / 1 place de la Pyramide La Defense 9
92800 Puteaux
2 350,00 € HT
Places disponibles
S'inscrire
Nancy
IBIS Style Nancy 8 allee de la Geneliere
54180 Houdemont
2 350,00 € HT
Places disponibles
S'inscrire
Metz
Mercure Metz Centre 29 pl Saint-Thiï¿½bault
57100 Metz
2 350,00 € HT
Places disponibles
S'inscrire
Marseille
World Trade Center 2 rue Henri Barbusse
13241 Marseille
2 350,00 € HT
Places disponibles
S'inscrire
Lille
Immeuble Le Corbusier 19, avenue Le Corbusier
59000 Lille
2 350,00 € HT
Places disponibles
S'inscrire
Aix en Provence
Pele d'activites d'Aix-en-Provence / Espace Cezanne 2eme etage 135, rue Andre Ampere
13290 Aix-en-Provence
2 350,00 € HT
Places disponibles
S'inscrire

Formation - Les bases du Machine Learning

Forfait Intra

Le forfait Intra comprend :

La formation dans vos locaux pour un groupe de 12 personnes maximum
L'ensemble des activités pédagogiques prévues dans la fiche de présentation de la formation
La documentation au format numérique
L'évaluation et l'émargement dématérialisés

Formation - Les bases du Machine Learning

Transformer des volumes massifs de données en informations utiles

A qui s'adresse cette formation ?

Pour qui

Prérequis

Le programme

1 - L'apprentissage machine (Introduction)

2 - Les fondamentaux de l'apprentissage machine

3 - La classification

4 - Les pratiques

5 - L'apprentissage d'ensembles (ensemble learning)

6 - La régression

7 - Le clustering

Evaluation

Les objectifs de la formation

Evaluation

Les points forts de la formation

Qualité des formations

Les avis de nos clients sur la formation

Sessions

Forfait Intra

Recevoir le programme par email

Envoyer le programme à un collaborateur

Preis