Formation machine learning avec R - Pyranhia

Formation de 5 jours pour maîtriser le Machine Learning supervisé avec R (tidymodels, keras) : de la théorie aux projets concrets.
Auteur·rice

Pyranhia

Mots clés

Machine Learning, R, tidymodels, Keras, Deep Learning, Data Science, Formation francophone

Machine Learning avec R

Développez des modèles prédictifs performants en 5 jours.

5
jours intensifs

6
participants max

4
types de modèles

1
projet concret

Objectifs

Acquérir les bases du Machine Learning supervisé avec R pour concevoir, évaluer et déployer des modèles prédictifs fiables en s’appuyant sur les écosystèmes tidymodels et keras.

À l’issue de la formation, vous saurez choisir le bon modèle, éviter les pièges classiques et interpréter les résultats dans le cadre de problèmes réels.

Pour qui ?

Développeurs, data‑scientists, analystes, managers techniques, personnes en reconversion.

Prérequis

Cette formation s’adresse à des personnes ayant déjà une première expérience avec R et des bases en statistiques.

Statistiques & logique

  • comprendre les notions de moyenne, médiane, variance et écart-type ;
  • distinguer variable quantitative et variable qualitative ;
  • savoir interpréter un tableau de données ;
  • comprendre la logique conditionnelle (“si”, “et”, “ou”).

Programmation R

  • être à l’aise avec les structures de base : data.frame, tibble, vecteurs ;
  • savoir manipuler des données avec dplyr : filter(), select(), mutate(), group_by(), summarise() ;
  • connaître les fonctions de base : summary(), str(), head(), mean() ;
  • avoir déjà créé un graphique avec ggplot2 (même basique) ;
  • utiliser le pipe |> ou %>%.

Environnement

  • savoir utiliser RStudio (console, éditeur de scripts, environnement) ;
  • avoir installé et chargé des packages avec install.packages() et library() ;
  • savoir sauvegarder et charger des données (CSV, RDS).

Question 1 : Manipulation de données

Vous avez un tableau penguins avec les colonnes species, bill_length_mm, body_mass_g. Que fait ce code ?

penguins |> 
  filter(species == "Adelie") |> 
  summarise(masse_moyenne = mean(body_mass_g))

Question 2 : Statistiques de base

Vous avez ces valeurs : 3, 5, 7, 9, 100. Laquelle de ces affirmations est vraie ?

Question 3 : Visualisation

Quel type de graphique ggplot2 utiliseriez-vous pour visualiser la relation entre deux variables quantitatives ?

Question 4 : Logique

Que retourne cette expression si x = 5 ?

(x > 3) & (x < 10)

Question 5 : Variables

Dans un dataset contenant des informations sur des voitures, laquelle de ces variables est qualitative ?

1-C | 2-B | 3-C | 4-A | 5-B

4/5 ou plus ? Vous êtes prêt·e pour cette formation !
Moins de 4/5 ? Consultez d’abord notre formation d’introduction à R.

Ce que vous allez maîtriser

  • concepts fondamentaux : apprentissage supervisé vs non‑supervisé, régression vs classification, notions de prédicteur vs cible, prédictif vs explicatif ;
  • validation et évaluation : data‑split, cross‑validation, métriques d’évaluation ;
  • modèles classiques : arbres de décision et dérivés (Random Forest, Boosting) avec tidymodels ;
  • introduction au Deep Learning : réseaux de neurones multilayer perceptron (MLP), CNN avec keras, transfer learning ;
  • gestion des données complexes : jeux déséquilibrés, dataset shift, données spatiales ;
  • interprétation : comprendre quelles variables influencent le modèle et visualiser leur impact.

Informations pratiques

Format En ligne via Posit Connect – aucune installation requise
Capacité Maximum 6 participants pour un suivi personnalisé
Durée 5 jours : 4 jours de formation + 1 jour de mise en pratique (cas pratiques thématiques + mini projet)
Tarif 1900€ HT (2280€ TTC)
Prochaine session Calendrier 2026 à venir
Inscription contact@pyranhia.eu

Vous repartez avec

  • Code R complet et commenté de tous les ateliers
  • Supports de cours accessibles en ligne
  • 2 séances de suivi post-formation (30 min)
  • Certificat de participation

Programme

Jour 1 : Bases du ML & premiers modèles

  • Définitions clés : ML/DL/IA, supervision, régression/classification
  • Principes : train/test split, cross-validation, métriques essentielles
  • Atelier : régression logistique & régression linéaire

Jour 2 : Modèles avancés & optimisation

  • Réseaux de neurones (MLP) : architecture et applications
  • Méthodes basées sur les arbres : Random Forest, Boosting
  • Introduction au tuning d’hyperparamètres (learning rate, nombre d’arbres)

Jour 3 : Optimisation avancée, biais & interprétation

  • Optimisation avancée des hyperparamètres
  • Gestion des biais liés aux déséquilibres de donnée
  • Interprétation des modèles : importance des variables et effets des prédicteurs

Jour 4 : Deep Learning & vision

  • Classification d’images : features vs pixels, limites du MLP
  • CNN : convolutions, deep features, transfer learning
  • Entraînement pratique avec keras
  • Aperçu des Transformers

Jour 5 : Mise en pratique

  • Cas pratiques thématiques : mises en situation concrètes pour consolider les acquis
  • Mini projet : cycle complet de ML sur un dataset réel dans un contexte métier qui vous correspond (santé, environnement, sciences sociales…)
  • Vous prenez les décisions, de l’exploration des données jusqu’à l’interprétation des résultats
  • Je reste disponible tout au long de la journée pour répondre à vos questions