Le processus ETL (Extraction, Transformation, Chargement)

5,342 views
4,844 views

Published on

Présentation général des étapes du processus ETL (Extract,Transform, Load) d'un projet décisionnel.

ETL, acronyme de Extraction, Transformation, Loading, est un système de chargement de données depuis les différentes sources d'information de l'entreprise (hétérogènes) jusqu'à l'entrepôt de données (modèles multidimensionnels).

Published in: Education
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
5,342
On SlideShare
0
From Embeds
0
Number of Embeds
22
Actions
Shares
0
Downloads
303
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Le processus ETL (Extraction, Transformation, Chargement)

  1. 1. ETL (Extract,Transform and Load) Extraction, Transformation et Chargement BENTALBA Salah Eddine «Consultant IT »
  2. 2. Le Processus Source de données ETL Entrepôt de données Staging DataWareHouse DataMarts
  3. 3. Extraction  Méthodes de Chargement : Chargement initial (Full) et les chargements incrémentiels (Delta). Données Sources Full Load Delta Load Données dans le staging
  4. 4. Extraction  Etudier les sources pour définir sa stratégie de chargement. Push Staging Pull Source de données ETL Push- Pull
  5. 5. Extraction Les questions à se poser selon la stratégie choisie pour définir les caractéristiques de votre système :  Quelle est la disponibilité de mes sources de données ?  Comment y accéder ?  Comment faire des chargements incrémentiels ?  Quel est le temps d'un chargement incrémentiel moyen, ai-je la possibilité de recharger des données dans le cas où mon processus de chargement échoue ?  Quelle politique vais-je utiliser dans le cas d'échec de chargement ?
  6. 6. Transformation Les questions à se poser avant de commencer cette étape :  Quels sont les champs les plus sujets à erreurs ?  Ai-je les moyens de corriger les erreurs automatiquement ?  Comment permettre à un utilisateur de corriger les erreurs ?  Quelle politique vais-je utiliser pour le traitement des erreurs (fichier log, table dans BD) ?  Comment montrer à l'utilisateur final que des données n'ont pas été totalement chargées à cause d'erreurs ?
  7. 7. Transformation Les données d’entrepôt doivent être : Dé-normalisées Nettoyées Contextualisées Chargées en DW
  8. 8.  Etape Critique. Load  Chargement des données dans l’entrepôt cible.  Utiliser une requête Insert SQL ou bien une insertion en bloc massif (bulk insert).  Des questions qu'il faut se poser lors de cette étape :     Que faire si un chargement échoue ? Ai-je les moyens de revenir à l'état avant le chargement ? Puis-je revenir dans le temps d'un chargement donné ? Comment valider mon chargement, comment détecter les erreurs ?
  9. 9. Métadonnées  Données décrivant l’environnement décisionnel.  Clé de réussite de tout projet décisionnel.  Assurent l'interopérabilité entre les systèmes.
  10. 10. Quel Outil ? Les éléments à prendre en compte dans le choix de votre ETL : Taille de l'entreprise Taille de la structure informatique Culture d'entreprise Maturité des solutions
  11. 11. Facebook.com/bentalba.Salaheddine Me Suivre Twitter.com/salahBentalba slideshare.com/salahBentalba About.me/salaheddine.bentalba Ma.linkedin.com/in/salaheddinebentalba

×