EXPÉRIENCES PROFESSIONNELLES

Oct. 2022 - Aujourd'hui (3 ans et 1 mois)

Consultant Data & IA Indépendant

Passionate Data

Oct. 2023 - mars 2025 (1 ans et 6 mois)

Tech Lead Data Engineering & Data Science @ Carrefour

  • Pilotage de la migration et de l'industrialisation des systèmes de personnalisation client sur l'écosystème Google Cloud Platform.
  • Conduite des chantiers d'optimisation de la plateforme de promotion ciblée sur l'écosystème Google Cloud Platform.
  • Garantie de la conformité et de la robustesse des solutions techniques par des processus de validation et de tests rigoureux.
  • Collaboration stratégique avec les équipes Produit et Marketing pour aligner la feuille de route technique avec les objectifs business.
GCP Python PySpark Airflow Cloud Composer Compute Engine Dataproc Cloud Storage App Engine Pub/Sub DataForm Firestore BigQuery Terraform Gitlab Scrum Planification de projet Gestion d'équipe Évaluation de la qualité Jira Confluence Google Workspace

Oct. 2022 - sept 2023 (1 an)

Data Engineer GCP @ Carrefour

  • Refonte et optimisation des pipelines de données sur GCP, entraînant une réduction de 90% des temps de traitement (de 30h à 3h) pour des millions de transactions quotidiennes.
  • Développement et déploiement d'algorithmes de Machine Learning pour les promotions ciblées, doublant le taux de conversion (+100%) des campagnes marketing.
  • Conception et mise en œuvre de solutions d'analyse en temps réel via l'optimisation des architectures de données (Pub/Sub).
  • Collaboration stratégique avec les équipes Produit et Marketing pour aligner la feuille de route technique avec les objectifs business.
GCP Python PySpark Airflow Cloud Composer Compute Engine Dataproc Cloud Storage App Engine Pub/Sub DataForm Firestore BigQuery Terraform Gitlab Scrum Jira Confluence Google Workspace

Mars 2020 - aout 2022 (2 ans et 6 mois)

Consultant Data Senior

KEYRUS

sept. 2021 - aout 2022 (1 an)

Data Product Owner & Data Quality Lead @ L'Oréal

  • Orchestration de projets analytiques en contexte international, en assurant la liaison entre les équipes techniques et les directions métier.
  • Pilotage de la migration de centaines de tables SAP critiques vers GCP, résultant en un accès aux données 2x plus rapide et une fiabilité accrue pour les rapports stratégiques.
  • Animation des comités de gouvernance de la donnée pour définir la feuille de route produit et prioriser le backlog en méthode Agile.
  • Garantie de la qualité et de l'intégrité des solutions analytiques via la supervision des phases de tests (UAT) et d'intégration.
GCP BigQuery Python Power BI SAP HANA Scrum Gestion de projet agile Microsoft Teams

mars 2021 - aout 2021 (6 mois)

Chef de Projet Data Science @ EIFFAGE

  • Pilotage du déploiement d'un modèle de Machine Learning prédisant la rentabilité des chantiers avec une précision de 80%, contribuant à améliorer la marge bénéficiaire.
  • Conduite des analyses exploratoires et de la validation des indicateurs pour identifier les variables les plus pertinentes.
  • Mise en place des protocoles de tests (unitaires et recettes) pour assurer la robustesse et la fiabilité du modèle en production.
  • Rédaction de la documentation technique et fonctionnelle complète pour garantir la maintenabilité.
Python Scikit-learn MS SQL Server Scrum Gestion de projet agile Jira Confluence Microsoft Teams

sept. 2020 - fevr. 2021 (6 mois)

Data Analyst @ Agence de Biomédecine

  • Conduite d'un audit national sur la qualité des données de plus de 400 centres de greffe cardiaque.
  • Développement d'un score de qualité pour évaluer et comparer la fiabilité des données transmises par chaque centre.
  • Identification d'incohérences critiques, menant à la création de nouvelles recommandations officielles pour harmoniser la collecte des données.
  • Rédaction et présentation du rapport d'audit servant de fondement à la nouvelle politique de gouvernance des données.
Python Scikit-learn Excel Microsoft Teams

mars 2020 - aout 2020 (6 mois)

Data Scientist @ DGFIP

  • Conception et déploiement d'un modèle de Machine Learning pour la détection de la fraude fiscale, améliorant significativement l'efficacité et la pertinence du ciblage des contrôles.
  • Analyse exploratoire et feature engineering sur des données à grande échelle pour identifier les comportements atypiques.
  • Développement d'algorithmes (clustering) pour identifier des schémas de fraude complexes, indétectables par les méthodes traditionnelles.
Python Scikit-learn MS SQL Server Microsoft Teams

Mars 2018 - Fév. 2020 (2 ans)

Consultant Data Senior

Publicis ETO

sept. 2018 - févr. 2020 (1 an et 6 mois)

Data Engineer GCP @ Carrefour

  • Participation au développement d'une plateforme de ciblage marketing omnicanal, générant un retour sur investissement de 5€ pour chaque euro investi.
  • Développement des pipelines de données (ETL) fondateurs sur GCP pour alimenter les algorithmes de personnalisation à grande échelle.
  • Création des premiers modèles de Machine Learning (propension d'achat) pour optimiser l'attribution des offres et augmenter leur taux d'utilisation.
GCP Python Scikit-learn Teradata BigQuery Cloud Function Cloud Storage Compute Engine App Engine Firestore Scrum Jira Confluence Google Workspace

mars 2018 - aout 2018 (6 mois)

Data Scientist @ RelaxNews

  • Conception et déploiement d'un moteur de classification automatique de documents (NLP) atteignant une précision de 90%.
  • Automatisation complète d'une tâche de tri manuelle, résultant en un gain de temps et une efficacité accrue pour le client.
  • Audit des sources de données et définition de la méthodologie de Text Mining pour le traitement et la valorisation du corpus de textes.
  • Présentation des performances du modèle et livraison de la documentation technique complète au client.
Python Scikit-learn Elasticsearch MS SQL Server Microsoft Teams

Mars 2017 - Fév. 2018 (1 an)

Consultant Data Scientist

Data Value Consulting

Data Scientist @ Econocom

  • Développement et déploiement d'un modèle de maintenance prédictive pour les parcs informatiques, atteignant une précision de 90% dans l'anticipation des pannes.
  • Contribution directe à la réduction des temps d'indisponibilité et à la diminution des coûts de maintenance grâce à une gestion proactive des incidents.
  • Mise en place d'une solution Big Data de bout en bout pour la collecte et la modélisation des données multi-sources.
  • Création de dashboards de pilotage sur Power BI, offrant un suivi en temps réel des KPIs et des alertes prédictives.
PySpark Python R MS Azure MS SQL Server Kibana Elasticsearch Power BI Microsoft Teams

Mars 2015 - Fév. 2017 (2 ans)

Data Scientist

Publicis Conseil

  • Initiation et développement d'un modèle (NLP) de détection en temps réel des problématiques de connexion Wi-Fi sur les réseaux sociaux pour Orange.
  • Identification d'un insight consommateur stratégique via l'analyse sémantique, menant à la campagne publicitaire "La Fibre 100% Fibre - Orange".
  • Mise en place de modèles d'analyse de données clients (segmentation, topic modeling) pour des comptes clés en support à la transformation digitale.
  • Collaboration active avec les équipes créatives pour traduire les insights data en recommandations stratégiques pour des clients prestigieux : Orange, BNP Paribas, AccorHotels, Nestlé, Sanofi, AXA, Renault, ENGIE.
Python PHP HTML/CSS Scikit-learn Gensim R Social Media APIs MongoDB