• Save
Les standards en biodiversité
Upcoming SlideShare
Loading in...5
×
 

Les standards en biodiversité

on

  • 1,193 views

Présentation des standards de données/métadannées en biodiversité et protocoles d'échange.

Présentation des standards de données/métadannées en biodiversité et protocoles d'échange.

Statistics

Views

Total Views
1,193
Views on SlideShare
1,143
Embed Views
50

Actions

Likes
0
Downloads
0
Comments
0

1 Embed 50

http://r21854.ovh.net 50

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Les standards en biodiversité Les standards en biodiversité Presentation Transcript

  • Les standards en biodiversité
    1er juillet 2010
    Natural Solutions
    julie_chabalier@natural-solutions.eu
  • Ma donnée
    Un gobe-mouche gris à Natural Solutions,
     Donnée : Elément d'information décrivant de façon élémentaire un objet, une transaction, un événement, etc. Une donnée sert de base à une recherche, un raisonnement, etc.
    Identifié par Amandine avec des jumelles
     Métadonnée : Donnée décrivant des caractéristiques d'une donnée, e.g. propriété, contenu, qualité (conditions, précision, etc.), date de saisie, etc.
  • Partager ma donnée (1)
    Taxon
    scientificName : Muscicapastriata
    class:Aves
    order : Passeriformes
    genus:Muscicapa
    Location
      country: France
    countryCode: FR 
      locality: Marseilles
    decimalLatitude: 43.17203
      decimalLongitude: 5.22445
     
    • Vocabulaire commun
    • Reconnu par la communauté
     Comprendre et utiliser la donnée
     Standard : format reconnu par une autorité ou majoritairement utilisé. Un standard permet la compatibilité des systèmes.
     Standard de données
  • Partager ma donnée (2)
     Utiliser la donnée au sein au sein d’un programme / système informatique
    <dwc:Taxon>
    <dwc:scientificName>Muscicapastriata</dwc:scientificName>
    <dwc:class>Aves</dwc:class>
    <dwc:order>Passeriformes </dwc:order>
    <dwc:genus>Muscicapa</dwc:genus>
    </dwc:Taxon>
    < dcterms:Location >
      < dwc:country > France < dwc:country >
     < dwc:countryCode > FR < dwc:countryCode >
      < dwc:locality > Marseille < dwc:locality >
    < dwc:decimalLatitude > 43.17203 < dwc:decimalLatitude >
      < dwc:decimalLongitude > 5.22445 < dwc:decimalLongitude >
     </dcterms:Location >
     Implémentation XML
  • Partager ma donnée (3)
    < protocol id =NSprotocol.1 >
    < title> Identification in a corridor </title>
    < creator>
    < individualName >
    < surName > Sahl </ surName >
    </ individualName >
    </ creator>
    < proceduralStep >
    < description >
      < para>Bird identification on a working place</ para >
     </ description >
     < instrumentation > binocular</ instrumentation >
      </proceduralStep>
    </protocol>
     Standard de metadonnées
  • Partager ma donnée (4)
     Protocole d’échange : les méthodes d'échange de données numériques entre plusieurs postes informatiques
  • 3 groupes de standards
    Les standards de métadonnées
     Comment sont mes données?
    Dublin Core
    EML
    Les standard de données
     Quelles sont les données à partager?
    DwC
    ABCD
    TCS
    Les protocoles d’échange
    • Comment je partage les données ?
    TAPIR
    LSID
    IPT

  • Les standards de métadonnées
    Problématique
    Différents types de données de biodiversité
    Stockagesvariés
    Echellesdifférentes
    Données dispersées
    Objectif
    Accéder aux jeux de données de biodiversité sur le Web
    Quellessont les donnéesdisponibles?
    Comment accéder à cesdonnées ?
  • Définitions
    Les métadonnéesdécrivent les ressources et leuraccessibilité
    identification
    qualité
    contexte spatial
    distribution des jeux de données
    Utiliser un standard de métadonnées
    uneterminologie commune
    un ensemble de définition
    Eviteruneperte du sens original des données
  • Dublin Core
    Standard de metadonnées le mieux connu actuellement
    Initié en 1995
    Objectif : découvrir les ressourcesdocumentaires du Web
    15 descripteurs minimums
    Implémentation XML
    http://dublincore.org/
  • Exemple
  • EcologicalMetadataLanguage
    Standard de metadonnéesdéveloppé par la communautéécologique
    Initié en 1997 par « Ecological Society of America »  
    Objectif : fournirsuffisamentd’information pour être capable de réutiliser les donnéesd’unemanièrescientifique
    • trèsbienstructuré avec de nombreuxdescripteurs
    Implémentation XML
    1500 projets, 65 milliards d’observations de tout types (i.e. organismes, climat, etc.)
    http://knb.ecoinformatics.org/
  • Organisation EML
    Descripteursorganisés en classes décrivant :
    le jeu de données (dataset)
    l’origine des données (citation)
    la structure des données (software)
    les méthodes de création du jeu de données (protocol)
    l’accessibilité des données (access)
  • Exemple
    http://harvardforest.fas.harvard.edu
  • Standard de données de biodiversité
    • Standard de données ≈ Format de données ≈ Schéma de données
    Echange de donnéesd’occurrenced’espèces
    Spécimensdans les collections d’histoirenaturelle et herbiers (collections vivantesincluses)
    Observations des organismesvivantssur le terrain
    2 standards
    Darwin Core
    ABCD schema
  • TDWG
    TaxonomicDatabaseWorking Group
    Biodiversity Information Standards
    Uneorganisationinternationale à but non lucratif
    Développe des standards et des protocoles pour partager les données de biodiversité
    www.tdwg.org
  • Historique
    TDWG/CODATA (Committee on Data for Science and Technology)
    Sous groupe «  Access to Biological Collections Data »
    2000
    Protocole de recherche des données de biodiversité
    Spécification des données des collections biologiques
    Projet BioCase
    DwC
    + protocole DIGIR
    ABCD Schema
    GBIF
    Protocole BioCase
  • DarwinCore
    Définition d’un ensemble d’éléments de données (data element)
    Unitéd’information de base : sens unique + valeursdistinctes
    Norme ISO ISO/IEC 11179 : lisibilitéet l’interchangeabilité des données
    Attributs/champs de base de données
    Objectif : partage et intégration des donnéesd’observationprimaires
    Initialement : organisation des collections de specimens
    Extensible (ajoutd’éléments de données) : fct des besoinsspécifiques
    http://rs.tdwg.org/dwc/
  • Les catégories
    172 éléments de données
    Organisés en 8 catégories/classes
    taxonID
    scientificNameID
    taxonConceptID
    scientificName
    kingdom
    phylum
    class
    order
    family
    genus
    subgenus
    taxonRank
    scientificNameAuthorship
    vernacularName
    nomenclaturalCode
    taxonomicStatus
    nomenclaturalStatus
    taxonRemarks

    Dublin Core
  • Des metadonnées?
    Un ensemble complémentaire de termes - Record-level Terms – pour caractériserle jeude données
    institutionID
    collectionID
    datasetID
    institutionCode
    collectionCode
    datasetName
    ownerInstitutionCode
    basisOfRecord
    informationWithheld
    dataGeneralizations
    dynamicProperties
    Darwin Core Type Vocabulary
     Valeur de l’élément de données
    Nature des données
    Occurrence
    Event
    Location
    Taxon
    PreservedSpecimen
    FossilSpecimen
    LivingSpecimen
    HumanObservation
    MachineObservation
    NomenclaturalChecklist
  • Le partage
    Tous les termessontassignés à une URI
    occurenceID : http://rs.tdwg.org/dwc/terms/occurrenceID
    implementation XML + XML/RDF
  • Extensions
    Information spécifique à une discipline
    Geospatial
    DecimalLatitude- DecimalLongitude – VerbatimCoordinates - …
    Paleontologie
    EarliestEonOrLowestEonothem – LatestEonOrHighestEonothem - EarliestEraOrLowestErathem - …
    Nettoyage ( Curation )
    IdentifiedBy- DateIdentified - FieldNotes - …
  • Simple Darwin Core
    Sous ensemble de 46 éléments de données
    Attributs des tableurs et bases de données
    Pas les termesreprésentant les différentescatégories (liste plate)
    Partage simple des donnéestaxonomiques et de leurs occurrences
  • Exemple
    <dwc:Taxon>
    <dwc:scientificName>Anthuscorrendera</dwc:scientificName>
    <dwc:class>Aves</dwc:class>
    <dwc:genus>Anthus</dwc:genus>
    <dwc:specificEpithet>correndera</dwc:specificEpithet> <dwc:occurrenceID>urn:catalog:AUDCLO:EBIRD:OBS64515286</dwc:occurrenceID>
    </dwc:Taxon>
  • Utilisation
    Largement utilisé
    GBIF (Global Biodiversity information facility) www.gbif.org
    OBIS (OceanBiogeographic Information System) www.iobis.org
    ALA (Atlas of Living Australia)
    www.ala.org.au
    Inventaires : ATBI (All Taxa Biodiversity Inventories and Monitoring) Mercantour

  • ABCD schema
    Schémahierarchique de spécification de données
    Echange des données de collections
    Specimens
    Observations
    Completdonccomplexe
     1200 éléments de données
    Capable d’intégrer des donnéesdétaillées, de sources trèsdifferentes et de domainestrèsspécifiques
    Suffisammentd’éléments de données pour être compatible avec beaucoup de standards
    Implémentation XML
    www.tdwg.org/activities/abcd/
  • Extrait
    Metadonnées?
  • Exemple
  • Visualiser ABCD schema
    http://www.bgbm.org/scripts/ASP/TDWG/frame.asp?config=0&configurl=http://www.bgbm.org/TDWG/CODATA/Schema/schemaviewer_configs/conf_abcd_206.xml
  • Extensions
    Extension pour les Geosciences (EFG) http://www.geocase.eu/
    Extension pour les données moléculaires (ADN) http://www.dnabank-network.org/
    Extension pour les herbiers http://hiscom.chah.org.au/wiki/HISPID_5
  • MappingDwC – ABCD schema
  • Utilisation
    Largement utilisé aussi (par les mêmes?)
    GBIF
    ALA

  • Taxon Concept schema(Taxonomic taxon transfert schema)
    Problématique
    Données de biodiversité des fournisseursbaséesgénéralementsur un seulréférentieltaxonomique
    Partager les donnéesnécessitentd’utiliser la mêmetaxonomie
    www.tdwg.org/standards/117/
  • Objectifs
    Développer un modèleabstrait de concepts taxonomiques
    Etablir des relations entre les concepts taxonomiques des fournisseurs de données
    Standard XML pour faciliterl’échange de données entre les différentsfournisseurs
    faciliterl’interrogation des données
  • Définitions
    TCS est un format d’échange de données
    • un moyend’annoter les donnéestaxonomiquescommuniquées
    2 élémentsclés
    <TaxonConcept> : monde réel, exprimeune opinion sur le taxon et ses relations avec d’autrestaxons
    <TaxonName> : nomenclature abstraite, encapsule les règles des différentes nomenclatures
  • Extrait
  • Exemple (1)
    <TaxonNames>
    <TaxonName id="123" nomenclaturalCode="Botanical">
    <Simple>Dianthus</Simple>
    <Rank code="gen">genus</Rank>
    </TaxonName>
    <TaxonName id="124" nomenclaturalCode="Botanical">
    <Simple>DianthusgratianopolitanusVill.</Simple>
    <Rank code="sp">species</Rank>
    <CanonicalName>
    <Simple>Dianthusgratianopolitanus</Simple>
    <Genusref="123">Dianthus</Genus>
    </CanonicalName>
    </TaxonName>
    <TaxonName id="125" nomenclaturalCode="Botanical">
    <Simple>Dianthuscaesius Sm.</Simple>
    <Rank code="sp">species</Rank>
    <CanonicalName>
    <Simple>Dianthuscaesius</Simple>
    <Genusref="123">Dianthus</Genus>
    <SpecificEpithet>caesius</SpecificEpithet>
    </CanonicalName>
    </TaxonName>
  • Exemple (2)
    <TaxonConcepts>
    <TaxonConcept id="988">
    <Name scientific="true" ref="124">Dianthus gratianopolitanusVill.</Name>
    <AccordingTo>
    <AccordingToSimple>
    Clapham, Tutin &amp; Moore (1987)
    </AccordingToSimple>
    </AccordingTo>
    <TaxonRelationships>
    <TaxonRelationship type="has synonym">
    <ToTaxonConceptref="989"/>
    </TaxonRelationship>
    </TaxonRelationships>
    </TaxonConcept>
    <TaxonConcept type="nominal" id="989">
    < Name scientific="true" ref="125">Dianthus caesius</Name>
    </TaxonConcept>
  • Utilisation
    GBIF dans son projet de « Global Names Architecture »
    TCS est utilisé pour faciliter l’échange des données taxonomiques.
  • Conclusion sur les standards de données
    DwC, ABCD schema et TSC spécifiques aux collections
    Moinsappropriés (pour l’instant) aux observations
    – Protocoles ?
    – Données manquantes ?
    – Regroupementautrequetaxonomique ?
    – Attributs spatiaux ?
    • En cours d’évolution
    • Utilisation conjointe avec les standards de métadonnées
  • Et après?
    Modèles de données ≠ standards de données
    Besoin de transformation des modèlesou de mise en relation (mapping) avec les standards
    espèce = SpecificEpithet
    alt m = MinimumElevationInMeters
    • Manipulation des donnéespeutêtrenécessaires
    Concatenation
    Parsing
    Changement de granularité
     Protocoles d’échange de données
  • Les protocoles
    Protocole = comment lierouéchanger les données
    • Protocoles existants
    – TAPIR
    LSID & RDF
    – DwC-A
    IPT
  • TAPIR
    Protocole pour interroger les bases de données existantes
    Remplace :
    DiGIR (utilisant DwC comme standard)
    BioCASe (utilisant ABCD schema comme standard)
    Indépendant du standard, mais un standard de donnéesestnécessaire
    Utilisé principalement par GBIF
    www.tdwg.org/activities/tapir
  • TAPIR
  • TAPIR
  • TAPIR
  • TAPIR
  • TAPIR
  • LSID & RDF
    LSID = Life Science Identifier
    Type de GUID = Global Unique Identifier
    LSID = chaîne de caractères + format
    urn:lsid:ubio.org:namebank:11815
    http://lsids.sourceforge.net/
  • LSID & RDF
    Utilisation :
    Identification d’un objet
    Retrouver les metadonnées associées (standard)
    RDF = Resource Description Framework
    RDF = Format de réponse des requêtes sur le LSID
    Nombreuxoutils pour résoudre et échanger les LSID
    http://lsid.tdwg.org/
  • LSID & RDF
    http://lsid.tdwg.org/urn:lsid:ubio.org:namebank:11815
  • Darwin Core archive
    Pas vraiment un protocole
    Moyen de publier les données au sein du GBIF
    DwC-A contient un jeu de donnéesentierbasésur des fichierstextes
    Le format DwC-A fournit un moyen simple de publiersesdonnées au format DwC + extensions
    Une archive = un ensemble de fichiertexteszippés
  • Dwc-A
  • IntegratedPublishingToolkit
    IPT = Une application web
    • Publier 3 types de données de biodiversité
    Données primaires
    Information sur les espèces
    Métadonnées sur les ressources
    • À partir d’une source de données
    Fichier plat
    Base de données
    Pour rendre ces données visibles sur le réseau distribué du GBIF
  • IPT
    -Portails de données
    -Réseaux distribués
    -Accès aux enregistrements
    individuels
    -Clients GIS
    -GeoPortals
    Catalogues de Métadonnées
    -Transport rapide des
    données
    -Création d’index
  • Conclusion
    Partager les données de biodiversité :
    Utiliser un standard de données
    Utiliser un standard de metadonnées
    Utiliser un protocole d’échange
    Applications