Work

Data engineering (SAS vers Dataiku, Capgemini)

Data
Dév
ETL

J'ai participé au développement d'une API de transcription de code SAS vers Dataiku.

Soft pink and baby blue water ripples together in a subtle texture.
🎯 Contexte
Chez Capgemini, j’ai participé à un projet stratégique de migration de traitements SAS vers Dataiku, dans un contexte de modernisation des outils data d’un grand client. L’objectif était clair : réduire les coûts de licence SAS tout en automatisant la transformation de données dans un environnement plus moderne et collaboratif (Dataiku).
💡 Mon rôle
Au sein d’une équipe de 10 personnes organisée en méthode Agile, j’ai pris en charge la partie la plus technique et innovante du projet :

Développement d’une API de migration automatique :
J’ai conçu et développé une API intelligente capable de :

  • Analyser un code SAS existant,
  • Identifier les étapes de transformation de données (tri, jointures, agrégations, etc.),
  • Générer automatiquement un flow Dataiku équivalent, reproduisant fidèlement les logiques du code SAS.

Cette solution permet de :

  • Réduire fortement le temps nécessaire à la migration,
  • Diminuer les erreurs de réécriture manuelle,
  • Standardiser les pratiques de transformation des données.
🔍 Résultats concrets
Division par 6 du temps de traitement : des tâches prenant 30 minutes sont désormais exécutables en moins de 5 minutes,
🛠 Réduction massive de l’effort de migration,
📉 Diminution significative de la dépendance aux outils SAS,
✅ Adoption rapide de la solution par les équipes techniques.
👨‍💻 Au-delà de la technique : autonomie et innovation
Ce projet m’a permis de : - Prendre le lead technique sur une problématique complexe et innovante, - Mettre en œuvre une logique de reverse engineering de code via parsing, - Collaborer efficacement avec une équipe pluridisciplinaire en mode Agile, - Apporter une solution concrète à forte valeur ajoutée métier.
🌟 Conclusion
Ce projet de migration a été un véritable levier d’optimisation des processus data. Il illustre ma capacité à : - Automatiser des workflows complexes à l’aide d’outils modernes comme Dataiku, - Développer des API intelligentes répondant à des enjeux industriels réels, - Allier innovation technique et efficacité opérationnelle.