• Save
Le projet EcoOnto  - avancees.
Upcoming SlideShare
Loading in...5
×
 

Le projet EcoOnto - avancees.

on

  • 757 views

Présentation des avancées du projet ecoOnto lors de la journée ecoOnto, 29 novembre 2010, Marseille.

Présentation des avancées du projet ecoOnto lors de la journée ecoOnto, 29 novembre 2010, Marseille.

Statistics

Views

Total Views
757
Views on SlideShare
742
Embed Views
15

Actions

Likes
0
Downloads
0
Comments
0

1 Embed 15

http://r21854.ovh.net 15

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Le projet EcoOnto  - avancees. Le projet EcoOnto - avancees. Presentation Transcript

  • Les avancées du projet ecoOnto : unexemple spécifique aux observations naturalistes Réunion ecoOnto – 29 novembre 2010 Faculté de Saint Jérôme, Marseille Julie Chabalier
  • Plan• Introduction – Le projet ecoOnto – Les outils collaboratifs• Le projet ecoOnto – Les résultats globaux – Un exemple
  • Le projet ecoOnto• Conception d’une ontologie de la biodiversité• Projet open source collaboratif – Soutenu par le MEEDDM, porté par Natural Solutions – Supervisé par un comité scientifique – Actuellement 24 membres – 18 mois (initialement janvier 2010 – juillet 2011) – 1er rapport d’étape : décembre.
  • Conception de l’ontologie• Une conception « bottom-up » en 4 phases – Inventaire des concepts environnementaux – Etude des standards actuels – Modélisation de ontologie de la biodiversité – Enrichissement de l’ontologie et validation
  • Les outils collaboratifs• Un site Webhttp://www.natural-solutions.eu/nslabs/• Une liste de diffusion/discussionecoonto-project@googlegroups.com• Un nouveau logo !http://r21854.ovh.net/xwiki/bin/download/Main/WebHome/logo-ecoOnto.jpg• Un wikihttp://r21854.ovh.net/xwiki/
  • ecoOnto Wiki• Droit d’accès : – En lecture à tous – En lecture/écriture aux membres (mdp sur demande)• Modification – WYSIWYG – Source (syntaxes implémentées : MediaWiki, Confluence, JSPWiki, Creole, TWiki, etc.)
  • L’écriture sur le wiki
  • L’écriture sur le wiki
  • Les résultats / WPWP 1 : Inventaire des concepts environnementaux WP1.1. Lister les questions environnementales WP1.2. Décomposer les questions WP1.3. Définir les concepts impliquésWP 2 : Etude des standards en biodiversitéWP 3 : Etude des ontologies existantes
  • WP1 .1 - Lister les questions • 35 questions (fr/en) • Classées en 3 catégories (Fondation pour la Recherche en Biodiversité, avril 2010) • Questions scientifiques • Questions politiques • Questions locales
  • WP1 .1 - Lister les questions• Scientifiques : 5 questions – Quelles sont les conséquences de l’introduction de la coccinelle orientale, Harmonia axyridis Pallas, sur l’écosystème européen ? – Quelle taille et quelle forme le corridor du Siju-Rewat devraient avoir pour améliorer les chances de survies de la population locale déléphant ?• Politiques : 12 questions – Quelles sont les méthodes pour évaluer la biodiversité de ma région ? – Comment délimiter le cœur de parc du futur Parc National des calanques ?
  • WP1 .1 - Lister les questions• Locales : 6 questions – Quel est l’impact de la mise en place d’une aire de stationnement de poids lourds au niveau de l’aire d’autoroute de Vidauban ? – Puis-je observer des Bouquetins dans le Parc National des Ecrins?• Non classées : 12 questions  concernent la collecte de données. – Quels sont les principaux protocoles déchantillonnage pour estimer la taille/densité dune population doiseaux ? – Combien de quadrats devraient être utilisés pour échantillonner efficacement laire X ?
  • WP1 .2 - Décomposer les questions7 questions ont été décomposées en 52 sous-questions Question 22 : Combien de quadrats devraient être utilisés pour échantillonner efficacement laire X ? 1. Quelles sont les espèces à observer ? 2. Quelle est la distribution spatiale des variables à mesurer (en massif, au hasard ou uniformément réparties, communes ou rares) ? 3. Quels sont les protocoles associés aux espèces à observer ? 4. Quelle est la taille de l’aire à étudier? 5. Quelles sont les ressources disponibles pour cet échantillonnage ( temps et argent) ? 6. Quels sont les résultats des tests préliminaires sur le terrain ?
  • WP1 .2 - Définir les concepts • 51 concepts définis (fr/en)Terme Synonymes Définition Référence Termespréféré associés  Plusieurs définitions/concept  Choix dans le cadre ecoOnto ?
  • WP1 .2 - Définir les concepts
  • WP1 .2 - Définir les concepts• Apport de la décomposition 7 questions : 15 concepts définis ou à définir52 sous-questions : 40 concepts définis ou à définir  + 25 termes (2,7 fois + de termes)
  • WP2 - Etude des standards actuels Dublin Core Standards de EML métadonnées Darwin Core GML ABCD schema ISO 19115 Taxon Concept SchemaStandards de données Standards de donnéesde biodiversité géographiques
  • WP3 - Etude des ontologies existantes• 30 ontologies de domaine : • Seronto, Oboe, BFO, DOLCE, Gazetter ontology, geonames, ENVO, Fly taxonomy, etc. Biologie 17 OWL 16 Géographie 11 OBO 12 Haut niveau 4 RDFS 2 • Visualisation : Ontology Browser (v1.4.1), Université de Manchester
  • Ontology Browser : OBOE
  • A faire …• Court terme : – Valider (choix) les définitions par les experts – Ajouter des définitions / questions existantes (éventuellement ajouter des questions)• Moyen terme : – Mappings concepts – standards – ontologies – Modélisation des concepts manquants• Long terme : – Validation de l’ontologie
  • Les observations naturalistesUne observation est une action dont le résultat est uneestimation de la valeur de certaines propriétés d’unecaractéristique dintérêt. Cette valeur est obtenue en utilisantune procédure spécifique.Open Geospatial Consortium
  • Choix des questions• Les critères – Collecte de données – Méthodes d’échantillonnage – Identification – Préparation de la collecte (recherche d’information cartographique, par exemple) – Données collectées
  • Les questions • 10 questionsCombien dobservations sont présentes dans le rectangle de sélection ?Combien dindividus de lespèce X ont été vus sur la zone Y ?Quels sont les principaux protocoles déchantillonnage pour estimer la taille/densité dunepopulation doiseaux ?Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonnerefficacement laire X ?Quelle est la précision et lexactitude de ce jeu de données ?Quel est le degré de confiance accordé à la détermination despèce réalisée par lobservateur X ?Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ?Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (dudomaine, i.e. taxon le plus élevé, à lespèce/sous-espèce, i.e. taxon le plus bas) ?Quelles étaient les valeurs des variables denvironnement pour cet échantillon de données ?Existe-t-il des couches de végétation disponibles pour laire détude ?
  • Classification & décomposition• Non classées• 10 questions : + 12 sous-questions  questions simples
  • Les concepts associés aux questions• 19 concepts à définirCombien dobservations sont présentes dans le rectangle de sélection ?Combien dindividus de lespèce X ont été vus sur la zone Y ?Quels sont les principaux protocoles déchantillonnage pour estimer la taille/densité dunepopulation doiseaux ?Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonnerefficacement laire X ?Quelle est la précision et lexactitude de ce jeu de données ?Quel est le degré de confiance accordé à la détermination despèce réalisée par lobservateur X ?Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ?Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (dudomaine, i.e. taxon le plus élevé, à lespèce/sous-espèce, i.e. taxon le plus bas) ?Quelles étaient les valeurs des variables denvironnement pour cet échantillon de données ?Existe-t-il des couches de végétation disponibles pour laire détude ?
  • Les concepts associés aux sous- questions • 8 concepts supplémentaires à définirQuel est le polygone correspondant à la zone étudiée ?Combien d’observations se trouvent dans ce polygone ?Combien d’individus de l’espèce X ont été observés dans ce polygone ?Quelles sont les espèces à observer ?Quelle est la distribution spatiale des variables à mesurer (en massif, au hasard ou uniformément,communes ou rares) ?Quels sont les protocoles associés à ces espèces ?Quelles sont les ressources disponibles pour cet échantillonnage ( temps et argent)?Quels sont les resultats des tests préliminaires sur le terrain ?Quelle est la date de l’échantillonage ?Combien d’unités d’échantillonage ont été visitées ?
  • Les définitions• Les publications• Dajoz R. Précis décologie, 615 p, Dunod, 2000.• Hellmann J. J., Fowler G. W. (1999) Bias, precision, and accuracy of four measures of species richness. Ecological Applications, Vol. 9, No. 3., pp. 824-834.• Mackay R.J. and Oldford R.W. (2000) Scientific Method, Statistical Method, and the Speed of Light. Working Paper.• Madin J., Bowers S., Schildhauer M., Krivov S.,Pennington D., Villa F. (2007) An ontology for describing and synthesizing ecological observation data. Ecological Informatics, Vol.2, No.3,pp 279-296 .• Mayr E. (1940) Speciation phenomena in birds. The American Naturalist Vol. 74, No. 752, pp. 249-278• Mayr E. (1992) Species Concepts and their Application. The units of evolution: essays on the nature of species, Ereshefsky ed. The MIT Press.• de Quieroz K., Donoghe M.J. (1990) Phylogenetic systematics and species revisited. Cladistics Vol. 6, No. 1, pp 83–90.• Ridley M. (1993) Evolution. Journal of Evolutionary Biology, Vol. 6, No. 4, pp 615–617, July 1993• Wiley E. O. (1981) Phylogenetics: the theory and practice of phylogenetic systematics. John Wiley and Sons, New York.
  • Les définitions• Les glossaires, codes et dictionnaires• Glossary for exploring GIS by Nicholas Chrismas• Glossary of the Federal Geographic Data Committee• Glossary of the Great Lakes Environmental Indicators Project• Glossary of terms and acronyms, Fisheries and Aquaculture Department of FAO• Glossary of statistical terms, Organization for economic co-operation and development• OceanLink’s Glossary of Common Terms and Definitions in Marine Biology• International Code of Zoological Nomenclature 1999• Larousse• Wiktionary
  • Mappings avec les standards• Méthode : mapping syntaxique simple + validation Standards Nb mappings exacts Nb mappings partiels ABCD Schema (2.06) 2 26 Darwin Core 1 12 (450-2991-1-SP) GML 2 8 (3.2.1) Accuracy (ABCD Schema) ABCD Schema : Identification (ABCD Schema) dateLastEdited Taxon (DwC) AcquisitionDate Observation (GML) AccessionDate Polygon (GML) MeasurementDate …
  • Mappings avec les ontologies• Choix des ontologies : observations  SERONTO : Socio-Ecological Research and Observation oNTology  OBOE : Extensible Observational Ontology
  • SERONTO core• Projet européen dont l’objectif est de faciliter l’intégration des données de biodiversité à partir des sources de données dispersées dans l’union européenne.• ALTER-net : A Long-Term Biodiversity, Ecosystem and Awareness Research Network (UE)
  • SERONTO Core
  • Mapping SERONTO core• Méthode : mapping syntaxique simple (classes et/ou propriétés) Nb mappings exacts Nb mappings partiels 5 7 Accuracy Landcore_area Area Political_area Population_Size IntendedSampleSize Precision hasSample Sampling_Protocol isSampleOf hasSamplingMethod
  • OBOE• Ontologie issue du projet SEEK (Science Environment for Ecological Knowledge) dont l’objectif était de créer une « cyberinfrastructure » pour la recherche en biodiversité, environnement et écologie et pour éduquer la communauté à l’écoinformatique (projet US).• LTER : Long Term Ecological Research (US)• http://seek.ecoinformatics.org.
  • OBOE core
  • Mapping OBOE core• Méthode : mapping syntaxique simple (classes et/ou propriétés) Nb mappings exacts Nb mappings partiels 2 3 Observation protocolFor Protocol UsesProtocol hasPrecision
  • Extension OBOE core• Créer un module observation ecoOnto – S’appuie sur les points d’extension décrits dans Madin et al. 2007 – Classification des concepts définis suivant les points d’extension : • Entity • Characteristic • Measurement – Modélisation des propriétés et classes supplémentaires
  • Les concepts• 15 concepts classés (sur 27)Entity Characteristic MeasurementSample Date SamplingProtocolPopulation Area IdentificationPolygon PopulationSizeQuadrat PopulationDensityTransect SpatialPatternIndividu Criteria EnvironnementalVariable
  • Les concepts (suite)• 12 concepts restants • 2 concepts existants (oboe:observation, oboe:hasPrecision) • 4 non classés (Protocol ≠ oboe:protocol, Resource, Layer, TaxonomicKey) • 3 concepts  associations (Observer, Accuracy, ConfidenceLevel) • 3 concepts exclus (Species, Taxon, Result)• Nouveaux concepts et propriétés • 7 classes supplémentaires (FieldSurvey, PopulationCharacteristic, SpatialLocation, etc.) • 5 propriétés supplémentaires (hasResource, isIdentifiedBy, includedEntity,etc.)
  • La classe Resource
  • La classe Entity Open Geospatial Consortium
  • Les classes Characteristic & Measurement
  • Intégration seronto:Accuracy  seronto:Area  seronto:Population_SizeAccuracy (ABCD Schema) seronto:Precision Identification (ABCD Schema)  seronto:Sampling_ProtocolTaxon (DwC) Observation (GML) Polygon (GML)
  • En cours et à suivre …• Implémentation en OWL-DL• Validation (cohérence + questions)