Nathan Leclercq #
nathan.leclercq9@protonmail.com | LinkedIn | GitHub | Blog | Télécharger en PDF
Profil #
Data Engineer et ML Engineer chez DataKhi depuis 3 ans (alternance puis CDI). Je conçois et opère des plateformes data de bout en bout : collecte, pipelines, modèles ML, déploiement, monitoring. Formation en mathématiques et informatique, Master Machine Learning (Lille). Je ne fais pas que du code — je déploie, j’industrialise et je livre.
Expérience Professionnelle #
DataKhi — Cabinet de conseil data, Tourcoing (2023 - présent) #
Data Engineer — Mission Nyukom · CDI · oct 2025 - présent
- Conception et déploiement d’une plateforme data télécom end-to-end : collecte (scraping 3CX, API Centreon), data lake MinIO, entrepôt PostgreSQL en schéma étoile, restitution Power BI
- Déploiement de l’infrastructure complète : K3s, Airflow, Ansible, registre Docker privé
- Gestion multi-client avec partitionnement, idempotence et backfill historique
- Stack : Airflow, K3s, Ansible, Docker, PostgreSQL, MinIO, Playwright, Pandas
ML Engineer — Mission Hall U Need · CDI (continuité alternance) · 2023 - présent
- Industrialisation d’un modèle de prédiction d’affluence restaurant (XGBoost quantile regression)
- Modèles de prédiction multi-restaurant, feature engineering (météo, calendrier, réservations)
- Loss function custom (Huber), calibration des intervalles de confiance, tests de non-régression
- Pipeline complet : collecte Microsoft Fabric → entraînement → prédiction · Workflow Makefile
Data Engineer & ML Engineer — Mission Tossée · Alternance · 2023 - 2025
- Architecture d’un écosystème data complet pour un agrégateur de mode éco-responsable
- Scraping multi-marques (Playwright, Scrapy, moteur de règles YAML custom)
- Pipeline de normalisation, calcul d’impacts environnementaux (API Ecobalyse), embeddings produit
- API backend (FastAPI, PostgreSQL/pgvector, recherche sémantique, recommandation)
- App mobile Flutter : essayage virtuel (DM-VTON), scan code-barres, OAuth multi-provider, géolocalisation
- Extension navigateur React/TypeScript pour affichage des impacts en temps réel
- Agent IA (OpenAI Agents SDK) pour extraction automatique de données depuis HTML
- Déploiement hybride on-premise / Azure (Functions, Blob, DevOps)
Développeur FullStack — Stage · 2023 · 4 mois
- Système de versioning pour PowerBI : backend C++ (différentiels de rapports), frontend React, distribution Electron
Professeur de Musique · 2017 - présent #
- Enseignement du saxophone (jazz, soul) et solfège — cours particuliers et écoles de musique
Compétences Techniques #
Data Engineering
- Pipelines ETL end-to-end, schéma en étoile, partitionnement, idempotence, backfill
- Apache Airflow · PostgreSQL · MinIO (S3) · Parquet / PyArrow · Microsoft Fabric
Machine Learning
- XGBoost (régression quantile) · Feature engineering · Cross-validation temporelle
- Embeddings / recherche vectorielle (pgvector) · CamemBERT / Transformers · MLflow
- Calibration d’intervalles de confiance · Loss functions custom
DevOps / Infrastructure
- Kubernetes (K3s) · Docker · Ansible (IaC, rôles, vault) · Proxmox
- Monitoring : Prometheus / Grafana · CI/CD : Makefile, pipelines
- Azure (Fabric, Functions, Blob, DevOps)
Développement
- Python (FastAPI, Pandas, scikit-learn) · SQL · TypeScript (React) · Dart (Flutter)
- Scraping : Playwright, Scrapy, BeautifulSoup
- Notions : Go, Rust, Haskell, C++
Langages scientifiques / algo
- Julia (compétitions : Google Hash Code, Reply Challenge, Cloudflight) · R · NumPy / SciPy
Projets Personnels #
Plateforme MLOps Homelab · 2024 - présent
- Infrastructure auto-hébergée : Proxmox, serveurs GPU, services ML, agents crewAI avec RAG
- Monitoring Prometheus/Grafana, déploiement Ansible, registre Docker, Gitea
- Articles techniques publiés
Système de Recommandation de Livres · 2023 - 2025
- Pipeline data complet : scraping d’un large catalogue de livres, embeddings (TF-IDF + CamemBERT), API FastAPI
- PostgreSQL/pgvector, MLflow, interface Vue.js
- Articles techniques publiés
Club Algorithmie · 2020 - 2024
- Préparation et participation aux compétitions de programmation
- Solutions optimisées en Julia · Google Hash Code, Reply Challenge, Cloudflight
Recherche : Harmonisation de Mélodies · 2024
- Étude comparative de modèles et algorithmes pour l’harmonisation musicale automatique
Formation #
Master Machine Learning · Université de Lille · 2023 - 2025
- Deep Learning, NLP, MLOps · Déploiement de LLMs sur infrastructure GPU
Licence Informatique · Université de Lille · 2020 - 2023
- Algorithmique avancée, architecture distribuée, développement fullstack
Cursus Mathématiques (L1-L3) · Université de Lille · 2017 - 2020
- Analyse numérique, probabilités/statistiques, algèbre linéaire appliquée
Langues #
- Français : natif
- Anglais : professionnel (TOEIC 885)
Centres d’intérêt #
- Musique : saxophone jazz/soul, orchestre
- Sport : vélo quotidien, badminton
- Lecture : science-fiction, essais techniques
- Jeux de rôle sur table