EXPÉRIENCES PROFESSIONNELLES
Oct. 2022 - Aujourd'hui (3 ans et 1 mois)
Consultant Data & IA Indépendant
Passionate Data
Oct. 2023 - mars 2025 (1 ans et 6 mois)
Tech Lead Data Engineering & Data Science @ Carrefour
- Pilotage de la migration et de l'industrialisation des systèmes de personnalisation client sur l'écosystème Google Cloud Platform.
- Conduite des chantiers d'optimisation de la plateforme de promotion ciblée sur l'écosystème Google Cloud Platform.
- Garantie de la conformité et de la robustesse des solutions techniques par des processus de validation et de tests rigoureux.
- Collaboration stratégique avec les équipes Produit et Marketing pour aligner la feuille de route technique avec les objectifs business.
GCP
Python
PySpark
Airflow
Cloud Composer
Compute Engine
Dataproc
Cloud Storage
App Engine
Pub/Sub
DataForm
Firestore
BigQuery
Terraform
Gitlab
Scrum
Planification de projet
Gestion d'équipe
Évaluation de la qualité
Jira
Confluence
Google Workspace
Oct. 2022 - sept 2023 (1 an)
Data Engineer GCP @ Carrefour
- Refonte et optimisation des pipelines de données sur GCP, entraînant une réduction de 90% des temps de traitement (de 30h à 3h) pour des millions de transactions quotidiennes.
- Développement et déploiement d'algorithmes de Machine Learning pour les promotions ciblées, doublant le taux de conversion (+100%) des campagnes marketing.
- Conception et mise en œuvre de solutions d'analyse en temps réel via l'optimisation des architectures de données (Pub/Sub).
- Collaboration stratégique avec les équipes Produit et Marketing pour aligner la feuille de route technique avec les objectifs business.
GCP
Python
PySpark
Airflow
Cloud Composer
Compute Engine
Dataproc
Cloud Storage
App Engine
Pub/Sub
DataForm
Firestore
BigQuery
Terraform
Gitlab
Scrum
Jira
Confluence
Google Workspace
Mars 2020 - aout 2022 (2 ans et 6 mois)
Consultant Data Senior
KEYRUS
sept. 2021 - aout 2022 (1 an)
Data Product Owner & Data Quality Lead @ L'Oréal
- Orchestration de projets analytiques en contexte international, en assurant la liaison entre les équipes techniques et les directions métier.
- Pilotage de la migration de centaines de tables SAP critiques vers GCP, résultant en un accès aux données 2x plus rapide et une fiabilité accrue pour les rapports stratégiques.
- Animation des comités de gouvernance de la donnée pour définir la feuille de route produit et prioriser le backlog en méthode Agile.
- Garantie de la qualité et de l'intégrité des solutions analytiques via la supervision des phases de tests (UAT) et d'intégration.
GCP
BigQuery
Python
Power BI
SAP HANA
Scrum
Gestion de projet agile
Microsoft Teams
mars 2021 - aout 2021 (6 mois)
Chef de Projet Data Science @ EIFFAGE
- Pilotage du déploiement d'un modèle de Machine Learning prédisant la rentabilité des chantiers avec une précision de 80%, contribuant à améliorer la marge bénéficiaire.
- Conduite des analyses exploratoires et de la validation des indicateurs pour identifier les variables les plus pertinentes.
- Mise en place des protocoles de tests (unitaires et recettes) pour assurer la robustesse et la fiabilité du modèle en production.
- Rédaction de la documentation technique et fonctionnelle complète pour garantir la maintenabilité.
Python
Scikit-learn
MS SQL Server
Scrum
Gestion de projet agile
Jira
Confluence
Microsoft Teams
sept. 2020 - fevr. 2021 (6 mois)
Data Analyst @ Agence de Biomédecine
- Conduite d'un audit national sur la qualité des données de plus de 400 centres de greffe cardiaque.
- Développement d'un score de qualité pour évaluer et comparer la fiabilité des données transmises par chaque centre.
- Identification d'incohérences critiques, menant à la création de nouvelles recommandations officielles pour harmoniser la collecte des données.
- Rédaction et présentation du rapport d'audit servant de fondement à la nouvelle politique de gouvernance des données.
Python
Scikit-learn
Excel
Microsoft Teams
mars 2020 - aout 2020 (6 mois)
Data Scientist @ DGFIP
- Conception et déploiement d'un modèle de Machine Learning pour la détection de la fraude fiscale, améliorant significativement l'efficacité et la pertinence du ciblage des contrôles.
- Analyse exploratoire et feature engineering sur des données à grande échelle pour identifier les comportements atypiques.
- Développement d'algorithmes (clustering) pour identifier des schémas de fraude complexes, indétectables par les méthodes traditionnelles.
Python
Scikit-learn
MS SQL Server
Microsoft Teams
Mars 2018 - Fév. 2020 (2 ans)
Consultant Data Senior
Publicis ETO
sept. 2018 - févr. 2020 (1 an et 6 mois)
Data Engineer GCP @ Carrefour
- Participation au développement d'une plateforme de ciblage marketing omnicanal, générant un retour sur investissement de 5€ pour chaque euro investi.
- Développement des pipelines de données (ETL) fondateurs sur GCP pour alimenter les algorithmes de personnalisation à grande échelle.
- Création des premiers modèles de Machine Learning (propension d'achat) pour optimiser l'attribution des offres et augmenter leur taux d'utilisation.
GCP
Python
Scikit-learn
Teradata
BigQuery
Cloud Function
Cloud Storage
Compute Engine
App Engine
Firestore
Scrum
Jira
Confluence
Google Workspace
mars 2018 - aout 2018 (6 mois)
Data Scientist @ RelaxNews
- Conception et déploiement d'un moteur de classification automatique de documents (NLP) atteignant une précision de 90%.
- Automatisation complète d'une tâche de tri manuelle, résultant en un gain de temps et une efficacité accrue pour le client.
- Audit des sources de données et définition de la méthodologie de Text Mining pour le traitement et la valorisation du corpus de textes.
- Présentation des performances du modèle et livraison de la documentation technique complète au client.
Python
Scikit-learn
Elasticsearch
MS SQL Server
Microsoft Teams
Mars 2017 - Fév. 2018 (1 an)
Consultant Data Scientist
Data Value Consulting
Data Scientist @ Econocom
- Développement et déploiement d'un modèle de maintenance prédictive pour les parcs informatiques, atteignant une précision de 90% dans l'anticipation des pannes.
- Contribution directe à la réduction des temps d'indisponibilité et à la diminution des coûts de maintenance grâce à une gestion proactive des incidents.
- Mise en place d'une solution Big Data de bout en bout pour la collecte et la modélisation des données multi-sources.
- Création de dashboards de pilotage sur Power BI, offrant un suivi en temps réel des KPIs et des alertes prédictives.
PySpark
Python
R
MS Azure
MS SQL Server
Kibana
Elasticsearch
Power BI
Microsoft Teams
Mars 2015 - Fév. 2017 (2 ans)
Data Scientist
Publicis Conseil
- Initiation et développement d'un modèle (NLP) de détection en temps réel des problématiques de connexion Wi-Fi sur les réseaux sociaux pour Orange.
- Identification d'un insight consommateur stratégique via l'analyse sémantique, menant à la campagne publicitaire "La Fibre 100% Fibre - Orange".
- Mise en place de modèles d'analyse de données clients (segmentation, topic modeling) pour des comptes clés en support à la transformation digitale.
- Collaboration active avec les équipes créatives pour traduire les insights data en recommandations stratégiques pour des clients prestigieux : Orange, BNP Paribas, AccorHotels, Nestlé, Sanofi, AXA, Renault, ENGIE.
Python
PHP
HTML/CSS
Scikit-learn
Gensim
R
Social Media APIs
MongoDB