Projets

Projets

Thème
Niveau

Gridworld Q-Learning

Navigation dans un labyrinthe avec Q-learning tabular

Proposé
RL / Multi-Agent Débutant

Implémentation from scratch de Q-learning tabular pour apprendre à naviguer dans un labyrinthe discret (GridWorld). Politique ε-greedy, convergence de la Q-table, visualisation de la politique apprise.

PythonNumPyMatplotlib

SARSA sur CartPole

Équilibrage de perche avec politique ε-greedy

Proposé
RL / Multi-Agent Débutant

Utilisation de SARSA (on-policy TD) pour résoudre CartPole-v1 de Gymnasium. Discrétisation de l'espace d'état, comparaison SARSA vs Q-learning, analyse de la sensibilité aux hyperparamètres (α, γ, ε).

PythonGymnasiumNumPyMatplotlib

Deep Q-Network (DQN)

Jeu Atari avec replay memory et réseau cible

Proposé
RL / Multi-Agent Réseaux de Neurones Intermédiaire

Implémentation du DQN de DeepMind : réseau neuronal pour approximer Q(s,a), experience replay buffer, réseau cible gelé pour la stabilité. Application sur Atari Pong ou LunarLander-v2.

PythonPyTorchGymnasiumNumPy

Prédateur-Proie Multi-Agent

Coopération émergente avec Q-learning indépendant

Proposé
RL / Multi-Agent Intermédiaire

Environnement multi-agent où plusieurs prédateurs doivent coopérer pour capturer une proie. Q-learning indépendant (IQL) par agent, analyse des stratégies émergentes et limites du paradigme indépendant (non-stationnarité).

PythonPettingZooNumPyMatplotlib

MADDPG — Jeu Compétitif

Multi-Agent Deep Deterministic Policy Gradient

Proposé
RL / Multi-Agent Réseaux de Neurones Avancé

Implémentation de MADDPG pour un environnement mixte coopératif-compétitif. Chaque agent a un acteur local et un critique centralisé. Analyse de la convergence, instabilités et techniques de stabilisation.

PythonPyTorchPettingZooNumPy

RL pour le TSP — Pointer Network

Résolution du Voyageur de Commerce via Reinforcement Learning

Proposé
RL / Multi-Agent Réseaux de Neurones Optimisation / OR Avancé

Utilisation d'un Pointer Network (mécanisme d'attention + RL) pour apprendre à résoudre le TSP. Comparaison avec les solveurs classiques (OR-Tools, heuristiques). Reproduit l'approche Bello et al. 2016.

PythonPyTorchNumPyOR-Tools

MLP from Scratch — MNIST

Réseau multicouche implémenté en NumPy pur

Proposé
Réseaux de Neurones Débutant

Construction d'un perceptron multicouche (MLP) de zéro avec NumPy : forward pass, rétropropagation, descente de gradient. Classification des chiffres manuscrits MNIST, visualisation des neurones.

PythonNumPyMatplotlib

CNN Classification — CIFAR-10

Réseau convolutif avec PyTorch

Proposé
Réseaux de Neurones Débutant

Conception et entraînement d'un CNN pour la classification d'images CIFAR-10. Convolutions, pooling, batch normalization, data augmentation, transfer learning avec ResNet.

PythonPyTorchMatplotlib

LSTM Séries Temporelles

Prévision de séries financières ou météo

Proposé
Réseaux de Neurones Machine Learning Intermédiaire

Modèle LSTM pour la prévision de séries temporelles (prix d'actions ou données météo). Fenêtrage temporel, normalisation, évaluation RMSE/MAE, comparaison avec ARIMA.

PythonPyTorchPandasScikit-learn

Autoencoder — Détection d'Anomalies

Détection non supervisée par reconstruction

Proposé
Réseaux de Neurones Machine Learning Intermédiaire

Autoencoder convolutif entraîné uniquement sur des données normales. Les anomalies sont détectées par seuil sur l'erreur de reconstruction. Application sur données industrielles (vibrations, logs réseau).

PythonPyTorchPandasScikit-learnMatplotlib

Transformer from Scratch

Implémentation complète du mécanisme d'attention

Proposé
Réseaux de Neurones Avancé

Implémentation du Transformer (Vaswani et al. 2017) de zéro : multi-head attention, positional encoding, encoder-decoder. Application sur traduction ou classification de texte.

PythonPyTorchNumPy

GNN — Graphes de Transport

Graph Neural Network pour prédiction et optimisation

Proposé
Réseaux de Neurones Optimisation / OR Avancé

Réseau de neurones sur graphe (GCN / GraphSAGE) appliqué à un graphe de transport. Prédiction de temps de trajet, détection de congestion, aide à la décision pour le routage optimal.

PythonPyTorchPyTorch-GeometricNetworkX

Knapsack Problem — DP & Heuristiques

Sac à dos 0/1 : programmation dynamique et heuristiques

Proposé
Optimisation / OR Débutant

Résolution du problème du sac à dos 0/1 par programmation dynamique exacte, Branch & Bound, et heuristiques greedy. Comparaison qualité/temps sur instances de tailles croissantes.

PythonNumPyMatplotlib

Coloration de Graphe

Algorithmes gloutons, backtracking, DSATUR

Proposé
Optimisation / OR Débutant

Implémentation et comparaison d'algorithmes de coloration de graphe : glouton, backtracking avec élagage, DSATUR. Application à la planification d'examens (éviter les conflits horaires).

PythonNetworkXMatplotlib

TSP — Métaheuristiques

Voyageur de Commerce : recuit simulé, tabou, génétique

Proposé
Optimisation / OR Intermédiaire

Résolution du TSP avec trois métaheuristiques : recuit simulé, recherche tabou, algorithme génétique. Benchmarks sur instances TSPlib, comparaison qualité/temps et visualisation des tournées.

PythonNumPyMatplotlibOR-Tools

Scheduling avec PLNE

Ordonnancement d'emploi du temps par programmation linéaire

Proposé
Optimisation / OR Intermédiaire

Modélisation et résolution d'un problème d'ordonnancement (emploi du temps étudiant ou planning d'équipes) par PLNE avec PuLP/CPLEX. Gestion des contraintes dures et molles, analyse de sensibilité.

PythonPuLPCPLEXPandas

Ring-Star Problem — Transport Public

Optimisation NP-difficile combinant p-médian et TSP

✓ Réalisé
Optimisation / OR Machine Learning Avancé

Modélisation du Ring-Star Problem (RSP) pour l'optimisation de réseaux de transport. Heuristiques constructives et d'amélioration itérative, formulation PLNE compacte, analyse sur instances TSPlib réelles avec variation du paramètre p.

PythonNumPyOR-ToolsMatplotlib

Optimisation Stochastique Guidée par ML

Heuristiques intelligentes pour problèmes d'OR sous incertitude

Proposé
Optimisation / OR Machine Learning Avancé

Apprentissage d'une politique de sélection de voisinage pour améliorer les heuristiques de recherche locale (Large Neighborhood Search guidé par ML). Application à la planification logistique avec demande incertaine.

PythonScikit-learnPuLPNumPyPandas

Analyse Parcoursup — Académie de Créteil

EDA, ML supervisé et non supervisé sur données réelles

✓ Réalisé
Machine Learning Débutant

Prétraitement et structuration de données Parcoursup. Feature engineering, sélection de variables, régression linéaire supervisée, ACP non supervisée, tests statistiques (χ²). Visualisation des disparités d'accès par académie.

PythonPandasNumPyScikit-learnMatplotlib

Régression & Classification from Scratch

Régression linéaire et logistique en NumPy pur

Proposé
Machine Learning Débutant

Implémentation de la régression linéaire (moindres carrés, gradient), de la régression logistique (sigmoïde, cross-entropy) et de la régularisation (L1/L2) sans bibliothèque ML. Visualisation des frontières de décision.

PythonNumPyMatplotlib

Ensemble Methods — XGBoost & SHAP

Random Forest, XGBoost et interprétabilité sur données tabulaires

Proposé
Machine Learning Intermédiaire

Pipeline complet de classification sur données tabulaires : Random Forest, Gradient Boosting, XGBoost avec tuning d'hyperparamètres (Optuna). Interprétabilité globale et locale via SHAP values.

PythonScikit-learnXGBoostSHAPPandas

Clustering & Réduction de Dimension

K-means, DBSCAN, GMM + visualisation UMAP / t-SNE

Proposé
Machine Learning Optimisation / OR Intermédiaire

Comparaison de K-means, DBSCAN et Gaussian Mixture Models sur des jeux de données variés (formes complexes, bruit). Visualisation en 2D via UMAP et t-SNE. Application : segmentation client ou détection de communautés dans des graphes.

PythonScikit-learnUMAPPandasMatplotlib

Pipeline ML Production-Ready

Feature selection, cross-validation, MLflow, déploiement

Proposé
Machine Learning Avancé

Construction d'un pipeline ML complet : sélection de features (recursive, SHAP), validation croisée imbriquée, traçage des expériences avec MLflow, exposition via FastAPI et conteneurisation Docker.

PythonScikit-learnMLflowFastAPIDocker

Time Series Forecasting + Attention

Prévision longue portée avec mécanisme d'attention

Proposé
Machine Learning Réseaux de Neurones Avancé

Modèle de prévision de séries temporelles longues (Informer / Temporal Fusion Transformer). Mécanisme d'attention temporelle, gestion de saisonnalités multiples, évaluation RMSE/MAPE vs baselines (ARIMA, Prophet, LSTM).

PythonPyTorchPandasScikit-learnMatplotlib