Formation Maîtrisez la complexité des architectures de données
- Data
- Formation détaillée
Planifier, construire, outiller et mettre en place : le rôle prépondérant de l’architecte de données
93% de participants satisfaits sur les 12 derniers mois
Objectifs
- Comprendre le métier d’architecte de données : ses liens avec le Data Office et avec l’équipe informatique, son rôle dans la mise en place d’une gouvernance, et dans le respect des conformités
- Savoir comparer les données, les traitements, les modèles et les architectures de données : de l’entrepôt de données à la modern data stack
- Être en capacité de détailler chaque schéma d’architecture, les formes de modélisation adaptées, les outils qui le composent, et l’illustrer d’une étude de cas
- Apprécier l’ensemble du cycle de vie des données, connaître et choisir les outils qui interviennent à chaque étape
Programme
1 – Architectures et architectes
- Le métier d’architecte de données
- Liste de ses tâches – Fiches de postes
- Les différents « architectes » (applications, données, système, technique, informatique, d’entreprise…)
- Points d’interaction avec les autres métiers du Data Office (CDO…)
- De l’application à la donnée : la Data Gravity
- Les livrables
2 – Typologie et formats de données
- Carte mentale des données d’entreprise
- Matrice multidimensionnelle de classement des types de données
- Structure, accessibilité (ouvertes, lisibles, chiffrées, anonymisées…), origine (données métiers, données techniques), température de stockage (froides, tièdes, chaudes), utilisation
- Les métadonnées derrière chaque donnée (de structure, d’exécution)
- Cycle de vie de la donnée, traitements et outils
- Rôle du catalogue de données
3 – Modélisation des données
- Modélisation vs non-modélisation
- Modélisation conceptuelle (MCD), logique (MLD) et physique (MPD)
- Quelques formes de modélisation : Relationnelle, Graphe, Multidimensionnelle, Colonnes, Documents, Clefs-valeurs, Vectorielle
- Quelle type de modélisation pour préparer ses données à l’intelligence artificielle ?
- Domain Driven Design (DDD)
4 – Cas d’applications et architectures types
Pour chacun des modèles ci-dessous, détaillons schéma d’architecture, technologies utilisées, cas d’application, et avantages / inconvénients de chaque architecture.
- Architecture d’un système opérationnel centralisé vs fédéralisé – le Domain Driven Design
- Architecture d’un système décisionnel centralisé (autour d’un data warehouse)
- Architecture d’un système de type Data Vault
- Architecture d’un système décisionnel orienté métiers – le Data Mesh
- Architecture d’un système Big Data autour du Data Lake
- Architecture de préparation des données pour l’apprentissage machine (Machine Learning) et l’IA générative
- Identification, traitement et stockage des données d’entraînement
- Architecture globale d’une plate-forme de données (Data Hub, Data Fabric…) sous plusieurs variantes
- Modern Data Stack : composants et positionnement
- Architecture globale d’une plateforme IoT (Internet des Objets)
5 – Architectures matérielles
- Les serveurs dédiés au stockage de données
- Les puces GPU pour le calcul, DPU (Data Processing Unit) et IPU (Infrastructure Processing Unit), les grappes de données (clusters)
- Panorama des solutions cloud de plateformes de données
- Stockage et conformité : La notion de « cloud souverain »
- Cloud, on-premise, hybride, ou edge
- Aligner le schéma d’architecture et les choix d’hébergement
- Température des données
- Les principales technologies (mémoire, disque SSD, disque dur, Hadoop, Amazon Glacier…) et automatisation des mouvements de données en fonction de leur température
- Stratégies de sauvegarde et restauration
- Sécurité des données (physique et logicielle)
- Sécurité des données et des transactions : Chiffrement, Authentification, Autorisations, Gestion des accès à privilèges
- Gestion d’une sécurité de bout en bout
6 – Architectures logicielles
- Panorama des bases de données opérationnelles et décisionnelles
- Bases de données graphes (Neo4j) et in-memory
- Plateformes combinant plusieurs types de données (Snowflake, Databricks…)
- Impact du Low-code / No-Code
- Bases de données partagées – Database as a Service (DBaaS)
- Virtualisation des données (Denodo, TIBCO, Informatica…)
- Les architectures d’alimentation
- ETL vs ELT, ESB (Enterprise Service Bus), CDC (Change Data Capture), API (Interfaces de Programmation d’Applications)
- Passer du traitement par lots aux flux de données en temps réel
- Le cas des objets connectés (IoT)
- Intégrité, consistance et gestion des versions
- Gestion des données de référence – Master Data Management (MDM)
- Comparaison des architectures possibles pour un MDM
- Sélectionner ses données de référence
- Les collecter, les stocker, et les exposer
- Panorama des solutions de Master Data Management
- ETL vs ELT, ESB (Enterprise Service Bus), CDC (Change Data Capture), API (Interfaces de Programmation d’Applications)
- La Business Intelligence (BI)
- Du reporting à la BI en libre-service
- Prévenir, identifier, traiter et intégrer l’informatique fantôme (Shadow IT)
- Notion de disponibilité
- Répartition, affectation de quotas, priorisation de services, équilibrage automatique…
- Bâtir un contrat de service (SLA) interne – Data Mesh et Data Contracts
- Mise en production : du DevOps au DataGovSecOps…
7 – Architectures de service
- Formes d’hébergement et solutions du marché (Amazon S3, Google Cloud Platform, Microsoft Azure…)
- Migrer ses données vers le cloud – solutions logicielles et matérielles (Amazon Snowball…)
- Critères de choix d’un prestataire
- Dans quels cas rester hébergé en interne
8 – Gouvernance des données
- Pas de gouvernance sans métadonnées
- Le rôle de l’architecte de données dans le comité de gouvernance
9 – Coûts et retour sur investissement (ROI)
- Budgétisation et mesure des coûts d’un hébergement hybride
- Le Finops, contrôleur de gestion de l’architecture de données
- Impact de l’architecture sur la valorisation des données : outils de mesure
- Participation au reporting CSRD (Comptabilité carbone)
10 – Réglementaire, normes et conformité
- Sur quelles normes s’appuyer pour construire son architecture de données
- DMBOK, le travail de l’association DAMA, Cobit 2019, ISO 24143 – la norme de gouvernance en devenir, ISO 8000 – Qualité des données…
- Contraintes règlementaires applicables aux architectures de données
- Sécurité : prévention des pertes / vols de données
- Data Act, Digital Act, Data Governance Act… réglementations européennes actuelles et futures
- Focus RGPD
- Place du registre des traitements dans l’architecture
- Position et gestion de la base des consentements
Ce programme a été mis à jour le 22 juillet 2024.
À qui s’adresse
cette formation ?
Public
Décideurs informatiques, urbanistes et architectes, consultants, ingénieurs et chefs de projets, maîtrises d’ouvrage.
Prérequis
Aucun.
Osez vous former à l’excellence
- Un décryptage des tendances
- Une « Bubble Care » d’exception
- Partager avec ses pairs
- Des espaces premium
Animateur
Le mot de l'animateur
« Cette formation est consacrée à l’architecture de données, mais je préfèrerais souligner qu’elle a été conçue pour les architectes de données. L’humain avant la théorie. L’application était au cœur du système d’information ; Aujourd’hui la donnée a pris le relais. L’architecture consacrée à la data en devient la clef de voûte. Le Domain/Data Driven Design sous-entend de nouvelles architectures, plus orientées utilisateurs. Le ou la Data Architect en est le cerveau. »
Philippe NIEUWBOURG
Découvrir l'animateurModalités
Méthodologie pédagogique
Cette formation concrète et pragmatique est illustrée par de nombreux exemples pratiques issus d’une expérience et d’un savoir-faire acquis sur de nombreux projets de taille variée au sein d’établissements et d’entreprises de différents secteurs. Support de cours téléchargeable en début de formation.
Méthodologie d’évaluation
Le stagiaire reçoit en amont de la formation un questionnaire permettant de mesurer les compétences, profil et attentes du stagiaire. Tout au long de la formation, les stagiaires sont évalués au moyen de différentes méthodes (quizz, ateliers, exercices et/ou de travaux pratiques, etc.) permettant de vérifier l'atteinte des objectifs. Un questionnaire d'évaluation à chaud est soumis à chaque stagiaire en fin de formation pour s’assurer de l’adéquation des acquis de la formation avec les attentes du stagiaire. Une attestation de réalisation de la formation est remise au stagiaire.
Osez vous former à l’excellence
Une vision globale pour réussir sa transformation
Un environnement propice
à la réflexion
Des opportunités de networking pour s’enrichir
Des espaces premium pour des formations d'exception
À qui s’adresse
cette formation ?
Public
Décideurs informatiques, urbanistes et architectes, consultants, ingénieurs et chefs de projets, maîtrises d’ouvrage.
Prérequis
Aucun.
Autres formations sur le même thème
Data
Gouvernance des données métiers : enjeux, méthodologie et outils
Prochaines sessions :
- 2-4 Déc 2024
- 7-9 Avr 2025
- 11-13 Juin 2025
- 10-12 Sep 2025
- 13-15 Oct 2025
- 24-26 Nov 2025
2960 € / pers. HT
Voir toutes les sessions Data
Anticipez vos enjeux business grâce à un système décisionnel et BI performant
Prochaines sessions :
- 25-27 Nov 2024
- 19-21 Mai 2025
- 1-3 Oct 2025
- 8-10 Déc 2025
2960 € / pers. HT
Voir toutes les sessions Data
Big Data : enjeux, applications et méthodologie
Prochaines sessions :
- 28-29 Nov 2024
- 5-6 Juin 2025
- 25-26 Sep 2025
- 27-28 Nov 2025
2197 € / pers. HT
Voir toutes les sessions Nouvelle Formation
Data
Mettre en place les reporting CSRD – ESG en s’appuyant sur des données pertinentes
Data
Data Mesh : retours d’expérience et guide pratique de mise en place
Prochaines sessions :
- 15-16 Mai 2025
- 18-19 Sep 2025
- 16-17 Oct 2025
2197 € / pers. HT
Voir toutes les sessions