Formation machine learning avec R - Pyranhia

Formation de 5 jours pour maîtriser le Machine Learning supervisé avec R (tidymodels, keras) : de la théorie aux projets concrets.

Auteur·rice

Pyranhia

Mots clés

Machine Learning, R, tidymodels, Keras, Deep Learning, Data Science, Formation francophone

Formation en cours de refonte

La formation Machine Learning avec R va prochainement être proposée en deux modules distincts. Les nouvelles sessions seront annoncées à partir d’octobre 2026.

Me contacter pour être informé·e en priorité

Machine Learning avec R

Développez des modèles prédictifs performants en 5 jours.

5
jours intensifs

6
participants max

4
types de modèles

1
projet concret

Télécharger le flyer

Voir le programme

S’inscrire à la formation

Objectifs

Acquérir les bases du Machine Learning supervisé avec R pour concevoir, évaluer et déployer des modèles prédictifs fiables en s’appuyant sur les écosystèmes tidymodels et keras.

À l’issue de la formation, vous saurez choisir le bon modèle, éviter les pièges classiques et interpréter les résultats dans le cadre de problèmes réels.

Pour qui ?

Développeurs, data‑scientists, analystes, managers techniques, personnes en reconversion.

Prérequis

Cette formation s’adresse à des personnes ayant déjà une première expérience avec R et des bases en statistiques.

Statistiques & logique

comprendre les notions de moyenne, médiane, variance et écart-type ;
distinguer variable quantitative et variable qualitative ;
savoir interpréter un tableau de données ;
comprendre la logique conditionnelle (“si”, “et”, “ou”).

Programmation R

être à l’aise avec les structures de base : data.frame, tibble, vecteurs ;
savoir manipuler des données avec dplyr : filter(), select(), mutate(), group_by(), summarise() ;
connaître les fonctions de base : summary(), str(), head(), mean() ;
avoir déjà créé un graphique avec ggplot2 (même basique) ;
utiliser le pipe |> ou %>%.

Environnement

savoir utiliser RStudio (console, éditeur de scripts, environnement) ;
avoir installé et chargé des packages avec install.packages() et library() ;
savoir sauvegarder et charger des données (CSV, RDS).

Testez vos connaissances (5 min)

Question 1 : Manipulation de données

Vous avez un tableau penguins avec les colonnes species, bill_length_mm, body_mass_g. Que fait ce code ?

penguins |> 
  filter(species == "Adelie") |> 
  summarise(masse_moyenne = mean(body_mass_g))

A) Affiche toutes les lignes de l’espèce Adelie
B) Calcule la masse moyenne de tous les manchots
C) Calcule la masse moyenne des manchots Adelie
D) Crée une nouvelle colonne masse_moyenne

Question 2 : Statistiques de base

Vous avez ces valeurs : 3, 5, 7, 9, 100. Laquelle de ces affirmations est vraie ?

A) La moyenne et la médiane sont identiques
B) La médiane est plus robuste aux valeurs extrêmes que la moyenne
C) L’écart-type est proche de 0
D) La variance est négative

Question 3 : Visualisation

Quel type de graphique ggplot2 utiliseriez-vous pour visualiser la relation entre deux variables quantitatives ?

A) geom_bar()
B) geom_boxplot()
C) geom_point()
D) geom_histogram()

Question 4 : Logique

Que retourne cette expression si x = 5 ?

(x > 3) & (x < 10)

A) TRUE
B) FALSE
C) 5
D) Une erreur

Question 5 : Variables

Dans un dataset contenant des informations sur des voitures, laquelle de ces variables est qualitative ?

A) Puissance en chevaux
B) Marque du véhicule
C) Prix en euros
D) Nombre de kilomètres au compteur

Réponses

1-C | 2-B | 3-C | 4-A | 5-B

4/5 ou plus ? Vous êtes prêt·e pour cette formation !
Moins de 4/5 ? Consultez d’abord notre formation d’introduction à R.

Ce que vous allez maîtriser

concepts fondamentaux : apprentissage supervisé vs non‑supervisé, régression vs classification, notions de prédicteur vs cible, prédictif vs explicatif ;
validation et évaluation : data‑split, cross‑validation, métriques d’évaluation ;
modèles classiques : arbres de décision et dérivés (Random Forest, Boosting) avec tidymodels ;
introduction au Deep Learning : réseaux de neurones multilayer perceptron (MLP), CNN avec keras, transfer learning ;
gestion des données complexes : jeux déséquilibrés, dataset shift, données spatiales ;
interprétation : comprendre quelles variables influencent le modèle et visualiser leur impact.

Informations pratiques

Format	En ligne sur RStudio Server, aucune installation requise
Capacité	Maximum 6 participants pour un suivi personnalisé
Durée	5 jours : 4 jours de formation + 1 jour de mise en pratique
Tarif	1900€¹
Sessions	Nouvelles sessions à partir d’octobre 2026
Inscription	Me contacter directement

Vous repartez avec

Code R complet et commenté de tous les ateliers
Supports de cours accessibles en ligne
2 séances de suivi post-formation (30 min)
Certificat de participation

Vous souhaitez accéder aux supports sans suivre la formation ?

Les supports pédagogiques sont disponibles en accès autonome.

Découvrir les supports

Programme

Jour 1 : Bases du ML & premiers modèles

Définitions clés : ML/DL/IA, supervision, régression/classification
Principes : train/test split, cross-validation, métriques essentielles
Atelier : régression logistique & régression linéaire

Jour 2 : Modèles avancés & optimisation

Réseaux de neurones (MLP) : architecture et applications
Méthodes basées sur les arbres : Random Forest, Boosting
Introduction au tuning d’hyperparamètres (learning rate, nombre d’arbres)

Jour 3 : Optimisation avancée, biais & interprétation

Optimisation avancée des hyperparamètres
Gestion des biais liés aux déséquilibres de donnée
Interprétation des modèles : importance des variables et effets des prédicteurs

Jour 4 : Deep Learning & vision

Classification d’images : features vs pixels, limites du MLP
CNN : convolutions, deep features, transfer learning
Entraînement pratique avec keras
Aperçu des Transformers

Jour 5 : Mise en pratique

Cas pratiques thématiques : mises en situation concrètes pour consolider les acquis
Mini projet : cycle complet de ML sur un dataset réel dans un contexte métier qui vous correspond (santé, environnement, sciences sociales…)
Vous prenez les décisions, de l’exploration des données jusqu’à l’interprétation des résultats
Je reste disponible tout au long de la journée pour répondre à vos questions

Retour aux formations

Découvrir les supports

S’inscrire à la formation

Notes de bas de page

TVA non applicable – art. 293 B CGI↩︎