L'agrégation de données géodécisionnelles : questions pour mieux la définir
Upcoming SlideShare
Loading in...5
×
 

L'agrégation de données géodécisionnelles : questions pour mieux la définir

on

  • 785 views

Les systèmes géodécisionnels de type SOLAP (Spatial On-Line Analytical Processing) sont dédiés à l’analyse spatio-temporelle des données ainsi qu’à leur exploration interactive selon une ...

Les systèmes géodécisionnels de type SOLAP (Spatial On-Line Analytical Processing) sont dédiés à l’analyse spatio-temporelle des données ainsi qu’à leur exploration interactive selon une approche dite multidimensionnelle. Cette approche exploite le croisement d’axes d’analyse (ex. produit, région, année) organisés en hiérarchies (ex. région : pays-province-région-MRC-ville) afin d’offrir plusieurs niveaux de détails d’information. Cette information ainsi obtenue se doit d’être pertinente et significative afin de servir le processus décisionnel. Il est donc primordial de s’assurer, dès la définition de ces systèmes, de leur adéquation avec les besoins identifiés. Pour obtenir les différents niveaux d’information synthèse, il est nécessaire d’agréger les données qui proviennent des systèmes opérationnels. Les exemples d’agrégation issus du monde OLAP appartiennent généralement à un monde déterministe où tout est parfaitement défini par des règles administratives et sans ambiguité, réalité à laquelle les phénomènes géographiques ne correspondent que rarement. L’agrégation de données géospatiales ne se résume pas seulement à simplement appliquer un opérateur d’agrégation sur un jeu de données comme on le fait pour les applications en comptabilité, en gestion des ventes ou en marketing. Ce processus s’avère plus complexe puisqu’il doit typiquement prendre en considération la nature géométrique et sémantique de la donnée géospatiale, les caractéristiques spatiales et sémantiques des axes d’analyse, les propriétés des opérateurs d’agrégation, le contexte de l’application, les besoins décisionnels, etc. La clé du succès repose alors sur l’expérience du concepteur d’application SOLAP puisqu’il doit effectuer plusieurs choix ayant des impacts sur les résultats et les types d’analyses possibles. Cette présentation portera donc sur les réflexions nécessaires à la définition d’un processus d’agrégation de données géospatiales approprié lors de la définition d’une application SOLAP. Elle traitera également des impacts potentiels des choix effectués sur l’information synthèse résultante, sur sa qualité et sur le type de décision escompté. Ces notions seront principalement présentées à l’aide d’exemples concrets de plusieurs domaines d’application.

Statistics

Views

Total Views
785
Views on SlideShare
778
Embed Views
7

Actions

Likes
0
Downloads
16
Comments
0

1 Embed 7

http://www.scoop.it 7

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    L'agrégation de données géodécisionnelles : questions pour mieux la définir L'agrégation de données géodécisionnelles : questions pour mieux la définir Presentation Transcript

    • L’agrégation de données géodécisionnelles :questions pour mieux la définir Eve Grenier Université Laval Yvan Bédard Université Laval Nicholas Chrisman Réseau GEOIDE, Université Laval Géomatique 2011 13 octobre 2011
    • Plan de la présentation Approche analytique Agrégation de données Questions
    • Approche analytique Type de véhicule CauseDate Secteur etheure Position Nb de passagers Nb de Nb de blessés décès
    • Approche analytiqueAxes d’analyse Type de véhicule Cause Date Secteur et heure Position Nb de passagers Nb de Nb de blessés décèsDonnées recherchées
    • Approche analytique • Axes d’analyse – Thématique 2005 – 2010 – Temporel Année Causes Mois Mécanique … Météo JourCrevaison … Panne Neige … Pluie Heure
    • Approche analytique• Axes d’analyse – Spatial géométrique Québec Province 01 – Bas-St-Laurent … 17 – Centre-du-QuébecRégions administratives MRC 070 – La Matapédia … 140 - Kamouraska Municipalités Kamouraska … Saint-Carmel
    • Approche analytique• Données recherchées – Données numériques ou géométriques – Opérateurs d’agrégation Passagers Blessés Décès Position Somme Somme Somme Regroupement 487 2 68 1 4 0
    • Agrégation de données• Processus d’agrégation Blessés – Donnée recherchée Somme – Opérateur d’agrégation – Axes d’analyse• Spécificités de l’agrégation géodécisionnelle – Type de géométrie – Définition sémantique – Interrelations spatiales – Comportement temporel
    • Agrégation de données• Validation du résultat Option 1 Option 2 Moyenne (A1) Population Moyenne Somme Somme (A2, A3, A4) Années Occupation Age Région
    • Question – Donnée recherchée• Données géospatiales – Données géométriques – Données descriptives Superficie : 15 ha – Métadonnées Superficie estimée en ha• Représentation multipleFeu no 325 Jour 1 Jour 2 Jour 3 Étendue totale
    • Question – Donnée recherchée• Données géospatiales – Données géométriques – Données descriptives Superficie : 15 ha – Métadonnées Superficie estimée en haQuelle représentation géométrique doit-on choisir?• Représentation multipleFeu no 325Convient-elle pour l’échelle de l’affichage souhaitée?Doit-on privilégier la donnée descriptive ou géométrique? Jour 1 Jour 2 Jour 3 Étendue totale
    • Question – Opérateur d’agrégationPosition d’accident routier Enveloppe convexe Ellipse de distribution
    • Question – Opérateur d’agrégationQuel opérateur/algorithme peut-on choisir pourmettre en valeur les données et répondre aux besoins?Est-ce que la nature de l’opérateur implique detraiter seulement les données détaillées?Est-ce que le résultat de l’agrégation est significatif?
    • Question – Axe d’analyse Option 1 1 maladie/personne Option 2 toutes les maladies nb personnes Maladie Option 3 règle d’agrégation spécifique par niveau Règle d’agrégation spécifiqueRégion socio-sanitaire Médecin
    • Question – Axe d’analyseEst-ce qu’il existe une relation unique entre la donnéerecherchée et l’axe d’analyse?Est-ce que le type d’axe d’analyse nécessitedes règles spécifiques afin d’agréger correctement?
    • Conclusion• Agrégation de données géodécisionnelles adéquate – Pas de solution unique – Traitement des données géospatiales plus complexe – Réflexions nécessaire – Impacts directs sur les décisions
    • Remerciements• Chaire industrielle CRSNG en bases de données géospatiales décisionnelles• CRSNG pour son financement
    • Merci de votre attention! Questions?
    • Types de donnée recherchée• Types de données numériques [Lenz et Shoshani, 1997] – Inventaire (stock ) : inventaire d’auto, nombre de citoyens – Cumul (flow ) : naissance mensuelle, revenu annuel – Valeur par unité (value-per-unit ) : coût par unité produite, taux de change• Types de données géospatiales – Phénomène ponctuel : position accident routier – Phénomène durable : segment de travaux routiers – Instantané de phénomène évolutif à fréquence temporelle fixe : feux de forêt évalué quotidiennement – Instantané de phénomène évolutif à fréquence temporelle variable suivant l’évolution
    • Classes opérateurs d’agrégation• 3 classes d’opérateurs [Gray et al., 1997] – Distributive Peut diviser les données à traiter en plusieurs ensembles disjoints sans affecter le résultat final Ex. somme, minimum, maximum – Algébrique Peut être exprimé comme une fonction d’opérateurs distributifs Ex. moyenne (somme / dénombrement) – Holistique Doit absolument être utilisé sur la totalité des données à évaluer pour obtenir le bon résultat Ex. médiane
    • Catégories opérateur agrégation• Opérateurs mathématiques (somme, moyenne, minimum, maximum)• Opérateurs géométriques (fusion, intersection, centroïde, enveloppe convexe)• Opérateurs combinant un opérateur mathématiques avec un opérateur d’analyse géospatiale (moyenne superficie, maximum intersection, somme- distance, densité surfacique)
    • Références• [Gray et al., 1997] Gray, J., S. Chaudhuri, et al. (1997). Data Cube: A relational aggregation operator generalizing group- by, cross-tab, and sub-totals, Data Mining and Knowledge Discovery, 1(1), pp. 29-53.• [Lenz et Shoshani, 1997] Lenz, H. & A. Shoshani (1997). Summarizability in OLAP and Statistical Data Bases. Proceedings of the 9th International Conference on Scientific and Statistical Database Management, Olympia, USA, pp. 132-143.