• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Geo web standards for biodiversity
 

Geo web standards for biodiversity

on

  • 977 views

Web Mapping, GeoRSS, Biodiversity Informatics

Web Mapping, GeoRSS, Biodiversity Informatics

Statistics

Views

Total Views
977
Views on SlideShare
974
Embed Views
3

Actions

Likes
0
Downloads
13
Comments
0

2 Embeds 3

http://www.linkedin.com 2
https://www.linkedin.com 1

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Geo web standards for biodiversity Geo web standards for biodiversity Presentation Transcript

    • Les standards en biodiversitéPartie 2
      1er juillet 2010
      Natural Solutions
    • Ma donnée
      Un gobe-mouche gris à Natural Solutions,
       Donnée : Elément d'information décrivant de façon élémentaire un objet, une transaction, un événement, etc. Une donnée sert de base à une recherche, un raisonnement, etc.
      Identifié par Amandine avec des jumelles
       Métadonnée : Donnée décrivant des caractéristiques d'une donnée, e.g. propriété, contenu, qualité (conditions, précision, etc.), date de saisie, etc.
    • Partager ma donnée (1)
      Taxon
      scientificName : Muscicapastriata
      class:Aves
      order : Passeriformes
      genus:Muscicapa
      Location
        country: France
      countryCode: FR 
        locality: Marseilles
      decimalLatitude: 43.17203
        decimalLongitude: 5.22445
       
      • Vocabulaire commun
      • Reconnu par la communauté
       Comprendre et utiliser la donnée
       Standard : format reconnu par une autorité ou majoritairement utilisé. Un standard permet la compatibilité des systèmes.
       Standard de données
    • Partager ma donnée (2)
       Utiliser la donnée au sein au sein d’un programme / système informatique
      <dwc:Taxon>
      <dwc:scientificName>Muscicapastriata</dwc:scientificName>
      <dwc:class>Aves</dwc:class>
      <dwc:order>Passeriformes </dwc:order>
      <dwc:genus>Muscicapa</dwc:genus>
      </dwc:Taxon>
      < dcterms:Location >
        < dwc:country > France < dwc:country >
       < dwc:countryCode > FR < dwc:countryCode >
        < dwc:locality > Marseille < dwc:locality >
      < dwc:decimalLatitude > 43.17203 < dwc:decimalLatitude >
        < dwc:decimalLongitude > 5.22445 < dwc:decimalLongitude >
       </dcterms:Location >
       Implémentation XML
    • Partager ma donnée (3)
      < protocol id =NSprotocol.1 >
      < title> Identification in a corridor </title>
      < creator>
      < individualName >
      < surName > Sahl </ surName >
      </ individualName >
      </ creator>
      < proceduralStep >
      < description >
        < para>Bird identification on a working place</ para >
       </ description >
       < instrumentation > binocular</ instrumentation >
        </proceduralStep>
      </protocol>
       Standard de metadonnées
    • Partager ma donnée (4)
       Protocole d’échange : les méthodes d'échange de données numériques entre plusieurs postes informatiques
    • 3 groupes de standards
      Les standards de métadonnées
       Comment sont mes données?
      Dublin Core
      EML
      Les standard de données
       Quelles sont les données à partager?
      DwC
      ABCD
      TCS
      Les protocoles d’échange
      • Comment je partage les données ?
      TAPIR
      LSID
      IPT

    • Les standards de métadonnées
      Problématique
      Différents types de données de biodiversité
      Stockagesvariés
      Echellesdifférentes
      Données dispersées
      Objectif
      Accéder aux jeux de données de biodiversité sur le Web
      Quellessont les donnéesdisponibles?
      Comment accéder à cesdonnées ?
    • Définitions
      Les métadonnéesdécrivent les ressources et leuraccessibilité
      identification
      qualité
      contexte spatial
      distribution des jeux de données
      Utiliser un standard de métadonnées
      uneterminologie commune
      un ensemble de définition
      Eviteruneperte du sens original des données
    • Dublin Core
      Standard de metadonnées le mieux connu actuellement
      Initié en 1995
      Objectif : découvrir les ressourcesdocumentaires du Web
      15 descripteurs minimums
      Implémentation XML
      http://dublincore.org/
    • Exemple
    • EcologicalMetadataLanguage
      Standard de metadonnéesdéveloppé par la communautéécologique
      Initié en 1997 par « Ecological Society of America »  
      Objectif : fournirsuffisamentd’information pour être capable de réutiliser les donnéesd’unemanièrescientifique
      • trèsbienstructuré avec de nombreuxdescripteurs
      Implémentation XML
      1500 projets, 65 milliards d’observations de tout types (i.e. organismes, climat, etc.)
      http://knb.ecoinformatics.org/
    • Organisation EML
      Descripteursorganisés en classes décrivant :
      le jeu de données (dataset)
      l’origine des données (citation)
      la structure des données (software)
      les méthodes de création du jeu de données (protocol)
      l’accessibilité des données (access)
    • Exemple
      http://harvardforest.fas.harvard.edu
    • Standard de données de biodiversité
      • Standard de données ≈ Format de données ≈ Schéma de données
      Echange de donnéesd’occurrenced’espèces
      Spécimensdans les collections d’histoirenaturelle et herbiers (collections vivantesincluses)
      Observations des organismesvivantssur le terrain
      2 standards
      Darwin Core
      ABCD schema
    • TDWG
      TaxonomicDatabaseWorking Group
      Biodiversity Information Standards
      Uneorganisationinternationale à but non lucratif
      Développe des standards et des protocoles pour partager les données de biodiversité
      www.tdwg.org
    • Historique
      TDWG/CODATA (Committee on Data for Science and Technology)
      Sous groupe «  Access to Biological Collections Data »
      2000
      Protocole de recherche des données de biodiversité
      Spécification des données des collections biologiques
      Projet BioCase
      DwC
      + protocole DIGIR
      ABCD Schema
      GBIF
      Protocole BioCase
    • DarwinCore
      Définition d’un ensemble d’éléments de données (data element)
      Unitéd’information de base : sens unique + valeursdistinctes
      Norme ISO ISO/IEC 11179 : lisibilitéet l’interchangeabilité des données
      Attributs/champs de base de données
      Objectif : partage et intégration des donnéesd’observationprimaires
      Initialement : organisation des collections de specimens
      Extensible (ajoutd’éléments de données) : fct des besoinsspécifiques
      http://rs.tdwg.org/dwc/
    • Les catégories
      172 éléments de données
      Organisés en 8 catégories/classes
      taxonID
      scientificNameID
      taxonConceptID
      scientificName
      kingdom
      phylum
      class
      order
      family
      genus
      subgenus
      taxonRank
      scientificNameAuthorship
      vernacularName
      nomenclaturalCode
      taxonomicStatus
      nomenclaturalStatus
      taxonRemarks

      Dublin Core
    • Des metadonnées?
      Un ensemble complémentaire de termes - Record-level Terms – pour caractériserle jeude données
      institutionID
      collectionID
      datasetID
      institutionCode
      collectionCode
      datasetName
      ownerInstitutionCode
      basisOfRecord
      informationWithheld
      dataGeneralizations
      dynamicProperties
      Darwin Core Type Vocabulary
       Valeur de l’élément de données
      Nature des données
      Occurrence
      Event
      Location
      Taxon
      PreservedSpecimen
      FossilSpecimen
      LivingSpecimen
      HumanObservation
      MachineObservation
      NomenclaturalChecklist
    • Le partage
      Tous les termessontassignés à une URI
      occurenceID : http://rs.tdwg.org/dwc/terms/occurrenceID
      implementation XML + XML/RDF
    • Extensions
      Information spécifique à une discipline
      Geospatial
      DecimalLatitude- DecimalLongitude – VerbatimCoordinates - …
      Paleontologie
      EarliestEonOrLowestEonothem – LatestEonOrHighestEonothem - EarliestEraOrLowestErathem - …
      Nettoyage ( Curation )
      IdentifiedBy- DateIdentified - FieldNotes - …
    • Simple Darwin Core
      Sous ensemble de 46 éléments de données
      Attributs des tableurs et bases de données
      Pas les termesreprésentant les différentescatégories (liste plate)
      Partage simple des donnéestaxonomiques et de leurs occurrences
    • Exemple
      <dwc:Taxon>
      <dwc:scientificName>Anthuscorrendera</dwc:scientificName>
      <dwc:class>Aves</dwc:class>
      <dwc:genus>Anthus</dwc:genus>
      <dwc:specificEpithet>correndera</dwc:specificEpithet> <dwc:occurrenceID>urn:catalog:AUDCLO:EBIRD:OBS64515286</dwc:occurrenceID>
      </dwc:Taxon>
    • Utilisation
      Largement utilisé
      GBIF (Global Biodiversity information facility) www.gbif.org
      OBIS (OceanBiogeographic Information System) www.iobis.org
      ALA (Atlas of Living Australia)
      www.ala.org.au
      Inventaires : ATBI (All Taxa Biodiversity Inventories and Monitoring) Mercantour

    • ABCD schema
      Schémahierarchique de spécification de données
      Echange des données de collections
      Specimens
      Observations
      Completdonccomplexe
       1200 éléments de données
      Capable d’intégrer des donnéesdétaillées, de sources trèsdifferentes et de domainestrèsspécifiques
      Suffisammentd’éléments de données pour être compatible avec beaucoup de standards
      Implémentation XML
      www.tdwg.org/activities/abcd/
    • Extrait
      Metadonnées?
    • Exemple
    • Visualiser ABCD schema
      http://www.bgbm.org/scripts/ASP/TDWG/frame.asp?config=0&configurl=http://www.bgbm.org/TDWG/CODATA/Schema/schemaviewer_configs/conf_abcd_206.xml
    • Extensions
      Extension pour les Geosciences (EFG) http://www.geocase.eu/
      Extension pour les données moléculaires (ADN) http://www.dnabank-network.org/
      Extension pour les herbiers http://hiscom.chah.org.au/wiki/HISPID_5
    • MappingDwC – ABCD schema
    • Utilisation
      Largement utilisé aussi (par les mêmes?)
      GBIF
      ALA

    • Taxon Concept schema(Taxonomic taxon transfert schema)
      Problématique
      Données de biodiversité des fournisseursbaséesgénéralementsur un seulréférentieltaxonomique
      Partager les donnéesnécessitentd’utiliser la mêmetaxonomie
      www.tdwg.org/standards/117/
    • Objectifs
      Développer un modèleabstrait de concepts taxonomiques
      Etablir des relations entre les concepts taxonomiques des fournisseurs de données
      Standard XML pour faciliterl’échange de données entre les différentsfournisseurs
      faciliterl’interrogation des données
    • Définitions
      TCS est un format d’échange de données
      • un moyend’annoter les donnéestaxonomiquescommuniquées
      2 élémentsclés
      <TaxonConcept> : monde réel, exprimeune opinion sur le taxon et ses relations avec d’autrestaxons
      <TaxonName> : nomenclature abstraite, encapsule les règles des différentes nomenclatures
    • Extrait
    • Exemple (1)
      <TaxonNames>
      <TaxonName id="123" nomenclaturalCode="Botanical">
      <Simple>Dianthus</Simple>
      <Rank code="gen">genus</Rank>
      </TaxonName>
      <TaxonName id="124" nomenclaturalCode="Botanical">
      <Simple>DianthusgratianopolitanusVill.</Simple>
      <Rank code="sp">species</Rank>
      <CanonicalName>
      <Simple>Dianthusgratianopolitanus</Simple>
      <Genusref="123">Dianthus</Genus>
      </CanonicalName>
      </TaxonName>
      <TaxonName id="125" nomenclaturalCode="Botanical">
      <Simple>Dianthuscaesius Sm.</Simple>
      <Rank code="sp">species</Rank>
      <CanonicalName>
      <Simple>Dianthuscaesius</Simple>
      <Genusref="123">Dianthus</Genus>
      <SpecificEpithet>caesius</SpecificEpithet>
      </CanonicalName>
      </TaxonName>
    • Exemple (2)
      <TaxonConcepts>
      <TaxonConcept id="988">
      <Name scientific="true" ref="124">Dianthus gratianopolitanusVill.</Name>
      <AccordingTo>
      <AccordingToSimple>
      Clapham, Tutin &amp; Moore (1987)
      </AccordingToSimple>
      </AccordingTo>
      <TaxonRelationships>
      <TaxonRelationship type="has synonym">
      <ToTaxonConceptref="989"/>
      </TaxonRelationship>
      </TaxonRelationships>
      </TaxonConcept>
      <TaxonConcept type="nominal" id="989">
      < Name scientific="true" ref="125">Dianthus caesius</Name>
      </TaxonConcept>
    • Utilisation
      GBIF dans son projet de « Global Names Architecture »
      TCS est utilisé pour faciliter l’échange des données taxonomiques.
    • Conclusion sur les standards de données
      DwC, ABCD schema et TSC spécifiques aux collections
      Moinsappropriés (pour l’instant) aux observations
      – Protocoles ?
      – Données manquantes ?
      – Regroupementautrequetaxonomique ?
      – Attributs spatiaux ?
      • En cours d’évolution
      • Utilisation conjointe avec les standards de métadonnées
    • Et après?
      Modèles de données ≠ standards de données
      Besoin de transformation des modèlesou de mise en relation (mapping) avec les standards
      espèce = SpecificEpithet
      alt m = MinimumElevationInMeters
      • Manipulation des donnéespeutêtrenécessaires
      Concatenation
      Parsing
      Changement de granularité
       Protocoles d’échange de données
    • Les protocoles
      Protocole = comment lierouéchanger les données
      • Protocoles existants
      – TAPIR
      LSID & RDF
      – DwC-A
      IPT
    • TAPIR
      Protocole pour interroger les bases de données existantes
      Remplace :
      DiGIR (utilisant DwC comme standard)
      BioCASe (utilisant ABCD schema comme standard)
      Indépendant du standard, mais un standard de donnéesestnécessaire
      Utilisé principalement par GBIF
      www.tdwg.org/activities/tapir
    • TAPIR
    • TAPIR
    • TAPIR
    • TAPIR
    • TAPIR
    • LSID & RDF
      LSID = Life Science Identifier
      Type de GUID = Global Unique Identifier
      LSID = chaîne de caractères + format
      urn:lsid:ubio.org:namebank:11815
      http://lsids.sourceforge.net/
    • LSID & RDF
      Utilisation :
      Identification d’un objet
      Retrouver les metadonnées associées (standard)
      RDF = Resource Description Framework
      RDF = Format de réponse des requêtes sur le LSID
      Nombreuxoutils pour résoudre et échanger les LSID
      http://lsid.tdwg.org/
    • LSID & RDF
      http://lsid.tdwg.org/urn:lsid:ubio.org:namebank:11815
    • Darwin Core archive
      Pas vraiment un protocole
      Moyen de publier les données au sein du GBIF
      DwC-A contient un jeu de donnéesentierbasésur des fichierstextes
      Le format DwC-A fournit un moyen simple de publiersesdonnées au format DwC + extensions
      Une archive = un ensemble de fichiertexteszippés
    • Dwc-A
    • IntegratedPublishingToolkit
      IPT = Une application web
      • Publier 3 types de données de biodiversité
      Données primaires
      Information sur les espèces
      Métadonnées sur les ressources
      • À partir d’une source de données
      Fichier plat
      Base de données
      Pour rendre ces données visibles sur le réseau distribué du GBIF
    • IPT
      -Portails de données
      -Réseaux distribués
      -Accès aux enregistrements
      individuels
      -Clients GIS
      -GeoPortals
      Catalogues de Métadonnées
      -Transport rapide des
      données
      -Création d’index
    • Conclusion
      Partager les données de biodiversité :
      Utiliser un standard de données
      Utiliser un standard de metadonnées
      Utiliser un protocole d’échange
      Applications