Aller au contenu

Curriculum Vitae

Nathan Leclercq
#

nathan.leclercq9@protonmail.com | LinkedIn | GitHub | Blog | Télécharger en PDF


Profil
#

Data Engineer et ML Engineer chez DataKhi depuis 3 ans (alternance puis CDI). Je conçois et opère des plateformes data de bout en bout : collecte, pipelines, modèles ML, déploiement, monitoring. Formation en mathématiques et informatique, Master Machine Learning (Lille). Je ne fais pas que du code — je déploie, j’industrialise et je livre.


Expérience Professionnelle
#

DataKhi — Cabinet de conseil data, Tourcoing (2023 - présent)
#

Data Engineer — Mission Nyukom · CDI · oct 2025 - présent

  • Conception et déploiement d’une plateforme data télécom end-to-end : collecte (scraping 3CX, API Centreon), data lake MinIO, entrepôt PostgreSQL en schéma étoile, restitution Power BI
  • Déploiement de l’infrastructure complète : K3s, Airflow, Ansible, registre Docker privé
  • Gestion multi-client avec partitionnement, idempotence et backfill historique
  • Stack : Airflow, K3s, Ansible, Docker, PostgreSQL, MinIO, Playwright, Pandas

ML Engineer — Mission Hall U Need · CDI (continuité alternance) · 2023 - présent

  • Industrialisation d’un modèle de prédiction d’affluence restaurant (XGBoost quantile regression)
  • Modèles de prédiction multi-restaurant, feature engineering (météo, calendrier, réservations)
  • Loss function custom (Huber), calibration des intervalles de confiance, tests de non-régression
  • Pipeline complet : collecte Microsoft Fabric → entraînement → prédiction · Workflow Makefile

Data Engineer & ML Engineer — Mission Tossée · Alternance · 2023 - 2025

  • Architecture d’un écosystème data complet pour un agrégateur de mode éco-responsable
  • Scraping multi-marques (Playwright, Scrapy, moteur de règles YAML custom)
  • Pipeline de normalisation, calcul d’impacts environnementaux (API Ecobalyse), embeddings produit
  • API backend (FastAPI, PostgreSQL/pgvector, recherche sémantique, recommandation)
  • App mobile Flutter : essayage virtuel (DM-VTON), scan code-barres, OAuth multi-provider, géolocalisation
  • Extension navigateur React/TypeScript pour affichage des impacts en temps réel
  • Agent IA (OpenAI Agents SDK) pour extraction automatique de données depuis HTML
  • Déploiement hybride on-premise / Azure (Functions, Blob, DevOps)

Développeur FullStack — Stage · 2023 · 4 mois

  • Système de versioning pour PowerBI : backend C++ (différentiels de rapports), frontend React, distribution Electron

Professeur de Musique · 2017 - présent
#

  • Enseignement du saxophone (jazz, soul) et solfège — cours particuliers et écoles de musique

Compétences Techniques
#

Data Engineering

  • Pipelines ETL end-to-end, schéma en étoile, partitionnement, idempotence, backfill
  • Apache Airflow · PostgreSQL · MinIO (S3) · Parquet / PyArrow · Microsoft Fabric

Machine Learning

  • XGBoost (régression quantile) · Feature engineering · Cross-validation temporelle
  • Embeddings / recherche vectorielle (pgvector) · CamemBERT / Transformers · MLflow
  • Calibration d’intervalles de confiance · Loss functions custom

DevOps / Infrastructure

  • Kubernetes (K3s) · Docker · Ansible (IaC, rôles, vault) · Proxmox
  • Monitoring : Prometheus / Grafana · CI/CD : Makefile, pipelines
  • Azure (Fabric, Functions, Blob, DevOps)

Développement

  • Python (FastAPI, Pandas, scikit-learn) · SQL · TypeScript (React) · Dart (Flutter)
  • Scraping : Playwright, Scrapy, BeautifulSoup
  • Notions : Go, Rust, Haskell, C++

Langages scientifiques / algo

  • Julia (compétitions : Google Hash Code, Reply Challenge, Cloudflight) · R · NumPy / SciPy

Projets Personnels
#

Plateforme MLOps Homelab · 2024 - présent

  • Infrastructure auto-hébergée : Proxmox, serveurs GPU, services ML, agents crewAI avec RAG
  • Monitoring Prometheus/Grafana, déploiement Ansible, registre Docker, Gitea
  • Articles techniques publiés

Système de Recommandation de Livres · 2023 - 2025

  • Pipeline data complet : scraping d’un large catalogue de livres, embeddings (TF-IDF + CamemBERT), API FastAPI
  • PostgreSQL/pgvector, MLflow, interface Vue.js
  • Articles techniques publiés

Club Algorithmie · 2020 - 2024

  • Préparation et participation aux compétitions de programmation
  • Solutions optimisées en Julia · Google Hash Code, Reply Challenge, Cloudflight

Recherche : Harmonisation de Mélodies · 2024

  • Étude comparative de modèles et algorithmes pour l’harmonisation musicale automatique

Formation
#

Master Machine Learning · Université de Lille · 2023 - 2025

  • Deep Learning, NLP, MLOps · Déploiement de LLMs sur infrastructure GPU

Licence Informatique · Université de Lille · 2020 - 2023

  • Algorithmique avancée, architecture distribuée, développement fullstack

Cursus Mathématiques (L1-L3) · Université de Lille · 2017 - 2020

  • Analyse numérique, probabilités/statistiques, algèbre linéaire appliquée

Langues
#

  • Français : natif
  • Anglais : professionnel (TOEIC 885)

Centres d’intérêt
#

  • Musique : saxophone jazz/soul, orchestre
  • Sport : vélo quotidien, badminton
  • Lecture : science-fiction, essais techniques
  • Jeux de rôle sur table

Publications
#