Air France, en tant qu’acteur majeur du transport aérien accompagne chaque année des millions de passagers tout autour du globe. Nos métiers, au-delà du service offert à nos clients, sont générateurs d’une grande diversité de données au quotidien, elles mêmes créatrices de valeur ajoutée et point de départ de nombreuses initiatives.

Le département de développement Data d’Air France, au sein de la direction
des Systèmes d’Information, intervient dans toute la chaîne de captation/traitement des données du groupe et historisation pour délivrer à nos métiers des solutions applicatives, des extractions ainsi que du reporting clés en main. En lien avec le pôle Ops responsable de la partie hardware il est également en charge de la supervision des outils (ETL, DataLakes, DataWarehouses, Data Visualisation) et du développement des talents et compétences de Data Engineering.

Au sein du département Data d’Air France, vous rejoindrez une équipe en charge de la gestion et de l’optimisation des pipelines de données Opérations Aériennes.

Dans un contexte post migration vers Cloud Google Platform (GCP), nous cherchons à transformer nos infrastructures et nos processus pour garantir performance, maintenabilité et scalabilité.

Le projet s’inscrit dans cette démarche de transformation digitale, visant à améliorer la gestion des données opérationnelles, notamment celles liées aux temps de consommation d’APU (Auxiliary Power Unit) durant les phases précédant et suivant le vol..

Le sujet de ce stage consiste en l’optimisation d’un script SQL complexe existant. Afin d’améliorer de lisibilité, de maintenance et de traçabilité, la ou le stagiaire aura pour mission de mener une refonte progressive du flux, en deux temps :

  • Découpage et clarification du script SQL :
  1. Analyser le script SQL existant pour en comprendre la logique métier et identifier les points d’optimisation.
  2. Refactoriser le code en utilisant des CTE (Common Table Expressions) et en créant des vues intermédiaires pour améliorer la lisibilité, la modularité et la traçabilité des étapes métier.
  3. Documenter les différentes étapes du script refactorisé.
  • Migration et industrialisation sur Dataform (GCP) :
  1. Participer à la migration du pipeline refactorisé vers Dataform sur Google Cloud Platform.
  2. Modéliser le pipeline en tables et vues Dataform, en tirant parti des capacités de l’outil.
  3. Mettre en place des tests unitaires pour garantir la qualité et la fiabilité des données.
  4. Rédiger une documentation technique et fonctionnelle complète du pipeline, facilitant sa maintenance et sa transmission.
  5. Contribuer à l’optimisation des performances du flux sur l’environnement GCP.

Ce projet représente une opportunité de moderniser un flux critique, d’acquérir une expertise concrète sur les technologies Cloud (GCP, Dataform) et de contribuer à la définition d’une méthodologie réutilisable pour la gestion agile et pérenne de nos pipelines data.

Vous êtes étudiant(e) en avant-dernière année de formation supérieure (Bac+4, Master ou école d’ingénieur) en informatique ou mathématiques appliquées, spécialisé(e) en Data Engineering, Business Intelligence, développement ou équivalent.

  • Vous avez un fort intérêt pour les technologies cloud, en particulier Google Cloud Platform (GCP).
  • Vous maîtrisez le langage SQL et avez une appétence pour l’analyse et l’optimisation de requêtes complexes.
  • Des connaissances en modélisation de données et/ou en outils d’orchestration de pipelines (comme Dataform) seraient un plus.
  • Vous êtes reconnu(e) pour votre curiosité, votre dynamisme, votre autonomie et votre rigueur.

Air France : Des données dans les nuages, mais des promesses au ras des pâquerettes

Air France, acteur majeur du transport aérien, promet une transformation digitale flamboyante, mais les réalités de la gestion des données semblent plus proches du vol plané que du décollage.

Dans un monde où chaque clic génère des données, Air France se présente comme le champion de l’optimisation des flux de données. Mais derrière cette façade technologique se cache une réalité qui mérite d’être examinée de plus près. Alors que l’entreprise se vante de sa migration vers Google Cloud Platform (GCP), on pourrait se demander si cette transformation est réellement à la hauteur des ambitions affichées.

Ce qui se passe réellement

Air France, en tant qu’acteur majeur du transport aérien, accompagne chaque année des millions de passagers tout autour du globe. Le département de développement Data, au sein de la direction des Systèmes d’Information, intervient dans toute la chaîne de captation et de traitement des données du groupe. Cela inclut la supervision des outils comme les DataLakes et DataWarehouses, tout en développant les compétences en Data Engineering. Actuellement, l’entreprise cherche à optimiser ses pipelines de données opérationnelles, notamment celles liées aux temps de consommation d’APU (Auxiliary Power Unit) durant les phases précédant et suivant le vol.

Pourquoi cela dérange

La promesse d’une transformation digitale efficace se heurte à la complexité des systèmes existants. La refonte d’un script SQL complexe pour améliorer la lisibilité et la traçabilité est une tâche louable, mais elle soulève des questions sur la gestion antérieure des données. Pourquoi avoir attendu si longtemps pour s’attaquer à ces problèmes ? La réponse semble se cacher derrière une bureaucratie lourde et des processus obsolètes.

Ce que cela implique concrètement

Les conséquences de cette situation sont multiples. D’une part, la nécessité d’une refonte progressive du flux de données indique une gestion des données qui a longtemps été négligée. D’autre part, la migration vers Dataform sur GCP, bien que prometteuse, pourrait se transformer en un casse-tête si les bases ne sont pas solides. Les tests unitaires et la documentation technique sont des étapes cruciales, mais elles ne devraient pas être des solutions de dernier recours.

Lecture satirique

Ironiquement, alors qu’Air France se positionne comme un pionnier de l’innovation, on pourrait se demander si cette transformation n’est pas qu’un simple effet d’annonce. Les promesses de performance et de scalabilité semblent s’évanouir face à la réalité des scripts SQL à optimiser. C’est un peu comme si l’on promettait un vol supersonique tout en continuant à faire le tour du pâté de maisons.

Effet miroir international

Dans un contexte mondial où des pays comme les États-Unis et la Russie adoptent des politiques de contrôle des données de plus en plus strictes, la question se pose : Air France est-elle en train de suivre une tendance inquiétante ? La gestion des données pourrait-elle devenir un outil de surveillance plutôt qu’un levier d’innovation ? La réponse reste à voir, mais les signes ne sont pas rassurants.

À quoi s’attendre

À l’avenir, il est probable que cette transformation digitale soit scrutée de près. Les attentes sont élevées, mais les résultats devront parler d’eux-mêmes. Si Air France ne parvient pas à surmonter ses défis internes, la promesse d’une gestion agile et pérenne des données pourrait rapidement se transformer en une chimère.

Sources

Source : recrutement.airfrance.com

AIR FRANCE - STAGE DATA ENGINEER
Visuel — Source : recrutement.airfrance.com
Partager ici :
Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

Laisser un commentaire