Data Engineering
De la donnée brute à une base exploitable : collecter, nettoyer, structurer.
- Nettoyage et préparation des données
- Construction de datasets
- Pipelines reproductibles (raw → clean → features)
- Big Data et stockage (SQL, NoSQL, S3)
Machine Learning · Computer Vision · NLP
En alternance · ouvert aux échanges et collaborations
Je construis des systèmes de machine learning concrets, de la donnée brute au modèle en production.
Je conçois des systèmes de machine learning pragmatiques et orientés impact.
Je pars de la donnée : comprendre, nettoyer, structurer et en extraire un signal exploitable. C'est le socle de tout le reste.
Je conçois ensuite des modèles : du NLP à la computer vision, en comparant les architectures et en évaluant rigoureusement chaque choix.
Enfin, je m'attache à la mise en production : pipelines reproductibles, conteneurisation, API et démos qui rendent un modèle réellement utilisable.
Mon approche reste pragmatique et orientée résultat. Ce qui me motive : comprendre un problème en profondeur, structurer, expérimenter, mesurer, améliorer.
De la donnée brute au modèle en production : robuste, reproductible, mesurable.
De la donnée brute à une base exploitable : collecter, nettoyer, structurer.
Concevoir des modèles utiles et mesurables, du NLP à la computer vision.
Rendre un modèle réellement utilisable : déployé, reproductible, fiable.
Vers des systèmes qui décident et agissent, pas seulement qui prédisent.
Trois projets concrets : computer vision, deep learning et NLP, du notebook au déploiement.
Détection en temps réel du port des équipements de protection (casque, gilet) sur images et vidéos. Pipeline YOLO11 entraîné sur le dataset SH17 (17 classes), avec alerte de non-conformité et démo Streamlit.
Classification d'intentions de tweets de support client par deep learning. Comparaison de 5 architectures (RNN, LSTM, BiLSTM, Transformer maison, DistilBERT) et déploiement via une API FastAPI.
Identification d'un livre à partir d'un extrait. Pipeline NLP complet (nettoyage, TF-IDF, Word2Vec, résumés MMR), stockage objet S3 et application Streamlit interactive.
Une question, une opportunité ou un projet à explorer en data, ML ou MLOps ? Écris-moi, je réponds.