Leclercq Nathan
nathan.leclercq9@protonmail.com
Profil
Étudiant en Master Machine Learning, je suis actuellement en alternance chez DataKhi, où je m’occupe principalement de la modélisation prédictive, du déploiement de solutions ML et de l’architecture MLOps. Je suis spécialisé dans la conception et le déploiement de solutions d’intelligence artificielle de bout en bout. Combinant une double formation en mathématiques et informatique avec une expérience pratique en Data Science et ingénierie des données, je développe actuellement une plateforme MLOps complète via mon homelab. Actuellement en Master Machine Learning, je recherche un poste permettant d’allier architecture de systèmes distribués et déploiement de solutions ML innovantes.
Expérience Professionnelle
Data Scientist (Alternance)
Hall U Need (via DataKhi), Tourcoing
2023 - présent
- Prédiction d’affluence et de vente par type de produit :
- Développement de modèles prédictifs basés sur des séries temporelles
- Optimisation des algorithmes pour réduire la marge d’erreur
- Couverture d’erreur à 90 %
- Adapté à différents types de volumétrie et de récurrence
- Finetuning de modèles d’embedding (CamemBERT) sur données textiles
- Résilience à l’overfitting et création de visualisations pour les équipes métiers
- Récolte et extrapolation de données météorologiques
- Utilisation de librairies d’autoML pour comparaison et sélection de modèles
- Stack technique : Python, Scikit-learn, Polars
Data Engineer & ML Engineer (Alternance)
Projet Tossée (via DataKhi), Tourcoing
2023 - présent
- Construction d’une application permettant l’affichage d’une note environnementale pour des produits textiles :
- Design d’une solution de Web Scraping Python
- Automatisation et déploiement hybrides sur serveurs locaux et Azure
- Flux de normalisation automatique avec techniques de NLP
- Finetuning de modèles d’embedding (CamemBERT) sur données textiles
- Infrastructure et bases de données :
- Conception et optimisation de bases de données (Graph, MongoDB, PostgreSQL avec pgvector)
- Développement et optimisation d’une API FastAPI (temps de réponse < 1 seconde)
- Conception et maintenance des applications front-end (OCR)
- Stack technique : Python, JavaScript, Flutter, Azure (Synapse, DevOps, Data Lake), Ansible, Kubernetes, SQL, MongoDB, GraphQL
Développeur FullStack (Stage)
Mission interne Datakhi, Tourcoing
2023 (4 mois)
- Architecture et développement d’un système de versioning pour PowerBI :
- Conception d’un backend performant en C++ gérant les différentiels de rapports
- Développement d’un frontend React avec visualisation sous forme de graphe
- Distribution via Electron pour compatibilité multi-plateforme
- Stack technique : C++, React, Electron, Git
Professeur de Musique
Écoles de musique, Apprentus
2017 - présent
- Enseignement du saxophone et du solfège
- Développement de supports pédagogiques personnalisés
Compétences Techniques
Data Science & ML
- Modélisation prédictive : Scikit-learn, PyTorch, TensorFlow
- MLOps : MLflow, Weights & Biases
- Traitement de données : Pandas, Polars
- NLP : Finetuning de modèles (CamemBERT), techniques d’embedding
- Big Data : Spark
Infrastructure & DevOps
- Cloud : Azure (Synapse, DevOps, Data Lake, Functions)
- Infrastructure as Code : Ansible, Terraform
- Conteneurisation : Docker, Kubernetes
- Monitoring : Prometheus, Grafana
- Linux : Administration système, scripting shell
Bases de Données
- Relationnelles : PostgreSQL (avec pgvector)
- NoSQL : MongoDB, Redis
- Graph Oriented Database
- Requêtage : SQL, GraphQL
Développement
- Backend : Python (FastAPI), Node.js, Go, Haskell
- Frontend : React, TypeScript, Vue.js, Flutter
- Langages système : C++, Rust
- Langages scientifiques : Julia, R
Formation
Master Machine Learning
Université de Lille
2023 - 2025
- Spécialisation : Deep Learning, NLP, MLOps
- Projets majeurs :
- Déploiement de LLMs sur infrastructure GPU
- Optimisation de systèmes de recommandation
Licence Informatique
Université de Lille
2020 - 2023
- Algorithmique avancée
- Architecture distribuée
- Développement fullstack
Licence Mathématiques
Université de Lille
2017 - 2020
- Bases solides en analyse numérique
- Fondements des probabilités et statistiques
- Algèbre linéaire appliquée
Projets Significatifs
Plateforme MLOps Homelab Depuis 2024
- Infrastructure complète avec serveurs GPU pour ML/DL
- Déploiement et entraînement d’agents avec crewAI basé sur un RAG
- Déploiement automatisé de services ML (LLMs, systèmes de recommandation)
- Monitoring et observabilité via Prometheus/Grafana
Système de Recommandation de Livres Septembre 2023 - Janvier 2025
- Pipeline de scraping et preprocessing de données (>100k livres)
- API de recommandation basée sur NLP et base vectorielle
- Interface utilisateur Vue.js avec visualisations
- Collecte des métriques et versioning des modèles avec MLflow
Animation Club Algorithmie Depuis 2024
- Organisation de sessions de préparation aux concours de programmation
- Implémentation de solutions optimisées en Julia
- Participation aux compétitions : Google Hash Code, Reply Code Challenge, Cloudflight Coding Contest
Compétences Transversales
- Curiosité technique : Veille technologique constante
- Rigueur et documentation : Approche méthodique des projets
- Autonomie : Capacité à mener des projets de bout en bout
- Esprit d’analyse : Résolution de problèmes complexes
- Travail en équipe : Collaboration efficace en environnement agile
Langues
- Français : Natif
- Anglais : Professionnel (TOEIC 885/B2)
Centres d’intérêt
- Musique : Saxophone (jazz, soul), participation à des orchestres
- Sport : Cyclisme quotidien, badminton
- Lecture : Science-fiction, essais techniques
- Jeux de rôle sur table