Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Portail d’ontologies et annotation sémantique de texte - Application en biomédecine et agronomie

350 views

Published on

Conférence donnée à l'INIST (Nancy en décembre 2017) dans le cadre du programme "Ingénierie des Connaissances"

Published in: Technology
  • Login to see the comments

  • Be the first to like this

Portail d’ontologies et annotation sémantique de texte - Application en biomédecine et agronomie

  1. 1. Portail d’ontologies et  annotation sémantique de texte Application en biomédecine et agronomie Clement Jonquet Maître de conférences en Informatique, Université de Montpellier (LIRMM) Chercheur invité à  l’Université de Stanford (boursier Marie‐Curie H2020) jonquet@lirmm.fr Conférences INIST  « Ingénierie des  connaissances 2022 » 5 décembre 2017 Nancy, France
  2. 2. • LIRMM • Clement Jonquet • Vincent Emonet • Anne Toulet • Andon Tchechmedjiev • Amine Abdaoui • Zohra Bellahsene • Amina Annane (ESI Algeria) • Mathieu Roche (CIRAD) • Sandra Bringay • Juan Antonio LossioVentura • Few MSc students / year • Collaborators • Pierre Larmande (IRD / IBC) • Mark Musen (BMIR) • John Graybeal (NCBO) • Stefan Darmoni (CISMEF) • Adrien Coulet (LORIA) • Elizabeth Arnaud (CGIAR) • Sophie Aubin (INRA) • Esther Dzalé‐Yeumo (INRA) Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 2
  3. 3. De quoi allons  nous parler  aujourd’hui ? De données et de Web sémantique D’ontologies et de librairies/portails  d’ontologies De 2 projets collaboratifs sur les services à  base d’ontologies pour la santé et l’agronomie  Challenges dans ces domaines  Conclusion Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 3
  4. 4. Quelques éléments sur  le Web sémantique &  les ontologies Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 4
  5. 5. Big Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 5 Open Linked
  6. 6. 6 Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France Evolution of the Linked Open Data  Cloud over the last 10 years http://lod‐cloud.net/
  7. 7. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 7
  8. 8. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 8 Explosion des  données aussi dans  l’agriculture
  9. 9. Le Web  sémantique  offre les  technologies  pour  standardiser les  ressources et  les rendre  interopérables Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 9
  10. 10. Tous les  éléments du  Web  sémantique  reposent sur  RDF Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 10
  11. 11. Ontologies  (petite) Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 11
  12. 12. Ontologies  (grosse) Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 12
  13. 13. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 13
  14. 14. Contexte scientifique et  objectifs du projet SIFR Indexation Sémantique de Ressources biomédicales  Francophones (www.lirmm.fr/sifr) Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 14
  15. 15. Explosion des  données en  biomédecine  La communauté biomédicale s’est tournée vers les ontologies et les  terminologies pour structurer ses données et les rendre  interopérables  Limite de l’indexation par mots clés  Créer des annotations sémantiques  Besoin vital d’outils pour la gestions des ontologies et l’annotation de  ressources en français  Challenge de l’intégration de données  Découvertes scientifiques cachées dans les données  Big / Open / Linked data Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 15
  16. 16. Les ontologies  et terminologies  (bio) médicales  ont adopté le  Web  sémantique  SNOMED‐CT est une ontologie qui est maintenant développée (quasi  nativement) en OWL  ICD11 est développée grâce a l’outil iCat (Stanford)  qui repose sur  Protégé l’éditeur de référence international pour les ontologies et  terminologies en santé  Le LIMICS (UMRS 1142) développe des ontologies dans chacun (ou  presque) de ses projets de recherche  Le NIH investi des millions de dollars sur l’interopérabilité des données  (BD2K program) et des ontologies (NCBO BioPortal)  FMA (Anatomie), HPO (Phénotypes), DO (Maladies), GO (Gene) sont des  ontologies OWL de références pour la gestion et l’annotation des  données Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 16
  17. 17. Indexer, fouiller,  chercher des  ressources de  données en  français… à  l’aide des  ontologies  Développer un workflow d’annotation sémantique de  données textuelles francophones et l’offrir sous forme  de service ouvert et public à la communauté  biomédicale française Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 17
  18. 18. Permettre la  création  d’applications  qui utilisent la  sémantique des  ontologies Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 18
  19. 19.  Sur qu’elle plateforme déposer et identifier facilement une terminologie  ou une ontologie dans le domaine de la santé en France ?  Pas nécessairement des terminologies standards  Les petits vocabulaires fait dans le cadre d’un projet  Les alignements  Les projets, la communauté, etc.  Se rapprocher du web sémantique  Quels outils sont disponibles facilement pour annoter sémantiquement du  texte avec des concepts d’ontologies ?  Je donne mon texte  Je ne me soucie pas des aspects sémantiques ou linguistique  Importance des aspects pratiques (en plus de la qualité): disponibilité,  service, abstraction, URI, paramétrables, etc. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 19
  20. 20. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 20  Des projets  (santé)  UMLF / VUMeF  InterSTIS (2007‐2010)  Des recensements  Neveol et al.,LREC 2014  Rapport ASIP Santé 2015: 71 terminologies recensées  Des ontologies/vocabulaires publiés sur des thématiques particulières  e.g., LIMICS, Bordeaux, Rouen, etc.  Des plateformes / outils pour la gestion de ressources sémantiques  ITM de Mondeca (et CAM)  HeTOP et F‐MTi/ECMT (CISMEF)  Des travaux sur la de fouille de texte et de données …  Des choses non limitées à la santé  TermSciences (INIST) … bientôt LOTERRE
  21. 21. A propos de librairies et  portails d’ontologies Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 21
  22. 22. Un portail  d’ontologies  pourquoi faire ?  Si j’ai développé une ontologie, comment je la met à disposition des  autres à moindre coût ?  Si j’ai besoin d’une ontologie, où est‐ce que je la récupère dans le  format de mon choix ou l’utilise en ligne ?   S’il existe plusieurs possibilités, comment savoir qu’elle ontologie  utiliser, laquelle est la plus appropriée pour ma tâche ?  Comment est‐ce que je peux utiliser les ontologies pour lier/annoter mes données ?  Comment utiliser les ontologies sans avoir à les gérer ? Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 22
  23. 23. Ontology  libraries &  repositories  Ontology libraries defined as   “a library system that offers various functions for managing,  adapting and standardizing groups of ontologies. It should fulfill  the needs for re‐use of ontologies. In this sense, an ontology  library system should be easily accessible and offer efficient  support for re‐using existing relevant ontologies and  standardizing them based on upper‐level ontologies and ontology  representation languages.” [Ding & Fensel, 2001]  Ontology repositories defined as   “a structured collection of ontologies (…) by using an Ontology  Metadata Vocabulary. References and relations between  ontologies and their modules build the semantic model of an  ontology repository. Access to resources is realized through  semantically‐enabled interfaces applicable for humans and  machines. Therefore a repository provides a formal query  language” [Hartmann, Palma, Gomez‐Perez, 2009] Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 23
  24. 24. Qu’est ce qui  existe comme  librairie et portail  d’ontologies ?  Ontology repositories / portal  NCBO BioPortal  Ontobee  AberOWL  EBI Ontology Lookup Service  OKFN Linked Open Vocabularies  ONKI Ontology Library Service  MMI Ontology Registry and  Repository   ESIPportal  AgroPortal  SIFR BioPortal  CISMEF HeTOP  OntoHub  Bartoc  TermSciences  Web indexes   Watson, Swoogle,  Sindice, Falcons  Ontology libraries / listings (more or  less updated)  OBO Foundry   WebProtégé  Romulus  DAML ontology library  Colore  FAO VEST Registry  Orhtolang  BioSharing  DERI Vocabularies ,  OntologyDesignPatterns,  Semanticweb.org, W3C Good  ontologies  Platform technology  Mondeca ITM, LexEVS, SKOSMOS  Abandoned projects  Cubboard, Knoodl, Schemapedia,  SchemaWeb, OntoSelect,  OntoSearch, TONES Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 24
  25. 25. Portail et service  d’annotation/inde xation vont  ensemble Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 25 BioPortal Annotator UMLS MetaMap OBO  Foundry Ontology Lookup Service Whatizit
  26. 26. Focus sur le NCBO  BioPortal :  “one stop shop”  pour les ontologies  biomedicales  Web repository for biomedical ontologies  Make ontologies accessible and usable – abstraction on format, locations, structure, etc.  Users can publish, download, browse, search,  comment, align ontologies  and use them for  annotations both online and via a web services  API. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 26
  27. 27. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 27 • Online support for ontology • Peer review & notes • Versioning • Mapping • Search • Resources • Annotation • Open source technology • Packaged in a “virtual  appliance” • Set up your own  “bioportal” in a few  hours
  28. 28. http://bioportal.bioontology.org Ontology  Services • Search • Traverse • Comment • Download Widgets • Tree‐view • Auto‐complete • Graph‐view Annotation Data Access Mapping  Services • Create • Upload • Download Term recognition Search “data” annotated with a   given term http://data.bioontology.org Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 28
  29. 29. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 29 NCBO BioPortal  data as of 2013
  30. 30. 2 projets collaboratifs qui  réutilisent la technologie  du NCBO Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 30
  31. 31. C. Jonquet, A. Annane, K. Bouarech, V. Emonet & S. Melzi.  SIFR BioPortal: French biomedical ontologies and  terminologies available for semantic annotation, In 16th  Journées Francophones d'Informatique Médicale JFIM'16. Genève, Suisse, July 2016. SIFR BioPortal Une plateforme ouverte et  générique pour les ontologies  françaises http://bioportal.lirmm.fr 25 ontologies/terminologies • Importées d’UMLS et d’HeTOP • Connectées au NCBO BioPortal • Déposées par les utilisateurs 31 Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
  32. 32. Elément  complémentaire  dans le paysage  français  Ouverte  N’importe qui peut soumettre du contenu  Générique  N’importe quel type de contenu et de format  Version spécifique du portail d’ontologie développé par le NCBO  Plateforme de rattachement pour le service d’annotation  25 (+4 privées) ontologies/terminologies médicales en français   Extraites de l’UMLS  Fournies par CISMeF (via export OWL)  Chargées directement par des utilisateurs  Construites à partir de format ad‐hoc  Connectées au NCBO BioPortal  255K classes Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 32 http://bioportal.lirmm.fr 
  33. 33. Ontologies et  terminologies  disponibles Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 33
  34. 34. Recherche dans  les ontologies Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 34
  35. 35. Alignements  entre  ontologies Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 35
  36. 36. Alignements  multilingues Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 36
  37. 37. Recom‐ mandation d’ontologies Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 37
  38. 38. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 38
  39. 39. Communauté Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 39
  40. 40. Projets qui  utilisent des  ontologies Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 40
  41. 41. French/SIFR  Annotator http://bioportal.lirmm.fr/annotator Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 41
  42. 42. Un nouvel outil  Détecter et localiser des concepts d’ontologies dans des données  textuelles  Utiliser la sémantique des ontologies pour étendre et exploiter ces  annotations  Service web   d’accès libre et public   facilement interconnectable  annotations aux formats standards comme JSON‐LD ou RDF  paramétrable Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 42
  43. 43. Pour du texte  donné Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 43
  44. 44. On obtient les  annotations Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 44
  45. 45. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 45
  46. 46. Des  fonctionnalités  pour le texte  clinique Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 46 Le patient ne montre aucun signe de fièvre. Son père a déjà eu  de l’arthrose. Il a des antécédents de dépression.
  47. 47. AgroPortal:  ontology  repository for  the agronomic  domain http://agroportal.lirmm.fr  Develop and support a reference ontology repository  Primary focus on the agronomy & close related domains (food, plant  sciences, and biodiversity)  Reusing the NCBO BioPortal technology  Avoid to re‐implement what has been done, facilitate interoperability  Reusing the scientific outcomes, experience & methods of the  biomedical domain   Enable straightforward use of agronomic related ontologies  Respect the requirements & specificities of the agronomic community   Fully semantic web compliant infrastructure  Enable new science Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 47 C. Jonquet, A. Toulet, E. Arnaud, S. Aubin, E. Dzalé‐Yeumo, V. Emonet, J. Graybeal, M‐A. Laporte, M. A.  Musen, V. Pesce & P. Larmande. AgroPortal: an ontology repository for agronomy, Computers and  Electronics in Agriculture. IN PRESS, 2017. pp. 30. Elsevier.
  48. 48. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 48
  49. 49. 5 Driving AgronomicUse  Cases  IBC Rice Genomics & AgroLD project  Data integration and knowledge management related to rice (P. Larmande)  RDA Wheat Data Interoperability working group  Common framework for publishing wheat data (E. Dzalé-Yeumo)  LovInra : INRA Linked Open Vocabularies Vocabularies produced by INRA scientists (S. Aubin)  Crop Ontology project  Ontologies for describing crop germplasm & traits (E. Arnaud)  GODAN global map of agri-food data standards  VEST/AgroPortal MAP of standards (V. Pesce) Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 49 Plus recement:  GDR SemanDiv
  50. 50. Exemples d’ontologies ou vocabulaires importées dans AgroPortal Title Forma t Groups Size IBP RiceTrait Ontology (CO_320) OWL CROP, RICE ~2K IBPWheatTrait Ontology (CO_321) OWL CROP, WHEAT ~1K IBPWheat Anatomy Ontology (CO_121) OBO CROP, WHEAT ~80 IBP Crop Research (CO_715) OBO CROP ~250 Multi‐Crop Passport Ontology (CO_020) OBO CROP ~90 Biorefinery (BIOREFINERY) OWL LOVINRA ~300 MatterTransfer (TRANSMAT) OWL LOVINRA ~1.1K Plant Ontology (PO) OWL WHEAT, RICE, OBOF ~2K PlantTrait Ontology (TO) OWL WHEAT, RICE, OBOF ~4.4K DurumWheat (DURUM_WHEAT) OWL LOVINRA ~130 Agricultural Experiments (AEO) OWL LOVINRA ~60 Environment Ontology (ENVO) OWL WHEAT, OBOF ~6.3K NCBI Organismal Classification (NCBITAXON)  RRF WHEAT ~900K AnaEEThesaurus (ANAEE) SKOS LOVINRA ~3.3K French Crop Usage (CROPUSAGE) SKOS none ~300 Agrovoc (AGROVOC) SKOS none ~32K Food Ontology (FOODON) OWL OBOF ~10K National Agriculture Library Thesaurus (NALT) SKOS none ~67K Global Agricultural Concept Scheme (GACS) SKOS none ~585K Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France D’intérêt pour  la biodiversité ENVO PATO ANAEE TO PO BCO TAXREF TOP … 50
  51. 51. Ontology groups  and categories Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France Category Number Plant Phenotypes andTraits 21 Plant Anatomy and Development 3 Natural Resources, Earth and Environment 9 Animal Science and Animal Products 6 Agricultural Research,Technology and Engineering 10 Breeding and Genetic Improvement 1 Plant Science and Plant Products 5 Plant Genetic Resources 2 Food and Human Nutrition 6 Taxonomic Classifications of Organisms 2 Farms and Farming Systems 3 Specific slices display to use only the ontologies of a group http://inra.agroportal.lirmm.fr/ 51
  52. 52. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 52 REST Service API: http://data.agroportal.lirmm.fr/documentation SPARQL endpoint: http://sparql.agroportal.lirmm.fr
  53. 53. Challenges pour les  portails d’ontologies et   propositions/resultats Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 53
  54. 54. Better ontology identification & selection  (via  ontology metadata) Multilingualism Ontology alignment (creation & use) Catching up with relevant data: annotations and linked data Generalized ontology‐based services  (keep quality while enabling horizontal studies) Scale  to multiple domain and to the number/variety of ontologies Challenges for  ontology  repositories Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 54
  55. 55. Better ontology identification & selection  (via  ontology metadata) Multilingualism Ontology alignment (creation & use) Catching up with relevant data: annotations and linked data Generalized ontology‐based services  (keep quality while enabling horizontal studies) Scale  to multiple domain and to the number/variety of ontologies Challenges for  ontology  repositories Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 55
  56. 56. Better ontology  identification &  selection  First role of an ontology repository is to handle ontology  metadata (model, extract, edit, valorize)  Everything about an ontology  Intrinsic properties e.g., name, URI, creation date  Relation to other ontologies e.g., imports, is mapped to, disagrees  with  Community contributions e.g. notes, project using, endorsements  Content‐based services e.g., SPARQL endpoint, bulk RDF  download, search  omv:usedOntologyEngineeringTool example  What does it say about your community? Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 56
  57. 57. Building a list  of properties to  describe  ontologies  Pickup properties  and relations from 23  existing vocabularies  Existing properties  in ontology  repositories  (especially BioPortal)  Non specific  properties that may  “return to the  ontology” 346 relevant properties that could be  used to described ontologies 127 used to build a new metadata model inside AgroPortal Ontology  repositories  metadata Other Interesting  vocabularies  (e.g., IDOT, PAV,  SD, DOAP, …) Standards &  Relevant (e.g.,  DC, DCAT, SKOS,  OWL, PROV,  OMV, VOID,  VOAF, MOD …) Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 57
  58. 58. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 58 Describe ontologies with semantic  metadata • Display “per ontology” • Ontology specific properties => viewable and editable  within the ontology specific page • Everything you need to know about an ontology • URIs used in the backend to store the information • e.g., CC‐BY =>  https://creativecommons.org/licenses/by‐nd/4.0/ • “Get my metadata back” buttons
  59. 59. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 59 Browse and select ontologies  Allows to search, order and select ontologies using a facetted  search approach, based on the metadata  4 additional ways to filter ontologies in the list  2 new options to sort this list (name, released date).
  60. 60. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 60 AgroPortal landscape page Display “per property”  Global presentation of the properties  Synthesis diagrams & listing  Allows to explore the agronomical ontology landscape by  automatically aggregating the metadata fields of each  ontologies in explicit visualizations (charts, term cloud and  graphs). C. Jonquet, A. Toulet, V. Emonet. Two years after: a review of vocabularies and  ontologies in AgroPortal, In International Workshop on sources and data integration in  agriculture, food and environment using ontologies, IN‐OVIVE'17. Montpellier, France, July  2017. pp. 13. EFITA.
  61. 61. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 61
  62. 62. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 62 Information about the community
  63. 63. Information  about the  ontology  network Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 63
  64. 64. Next steps  Develop a new standard ontology metadata model  Harmonize ontology repositories  MOD project: Metadata for Ontology Description and  Publication Ontology  https://github.com/sifrproject/MOD‐Ontology  Add features within ontology editors Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 64
  65. 65. Better ontology identification & selection  (via  ontology metadata) Multilingualism Ontology alignment (creation & use) Catching up with relevant data: annotations and linked data Generalized ontology‐based services  (keep quality while enabling horizontal studies) Scale  to multiple domain and to the number/variety of ontologies Challenges for  ontology  repositories Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 65
  66. 66. Catching up  with relevant  data:  annotations  and linked data  Data deluge  Not necessarily  connected to  relevant ontologies  Annotate data with  ontology concepts  Horizontal approach ONTOLOGIES RESOURCES Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 66 C. Jonquet, P. LePendu, S. Falconer, A. Coulet, N. F. Noy, M. A. Musen & N. H. Shah. NCBO  Resource Index: Ontology‐Based Search and Mining of Biomedical Resources, Web  Semantics. September 2011. Vol. 9 (3), pp. 316‐324. Elsevier.
  67. 67. Ontology – data  cycle  Ontologies and data change everyday  Need to be able to handle the “deltas” only  Work on terminology and knowledge extraction from text  BioTex (http://tubo.lirmm.fr/biotex)  Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 67 J.A. Lossio-Ventura, C. Jonquet, M. Roche & M. Teisseire. Biomedical term extraction: overview and a new methodology, Information Retrieval, Special issue on Medical Information Retrieval. August 2015. Vol. 19 (1), pp. 59-99. Springer.
  68. 68. The role of the  ontology  repository is  not clear here  We built the NCBO Resource Index as a  searchable  database of around 50 biomedical  resources semantically indexed, with  annotations  Since then, linked open data has become the  approach in the semantic web  In agronomy: build a database of resources  described in RDF, and annotated with  ontologies: the AgroLD project  Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 68
  69. 69. AgroLD semantic web oriented  data integration  platform for plant  biology www.agrold.org Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 69
  70. 70. Ontologies Knowledge in AgroLD multiple data sources annotated with  reference ontologies Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 70 Multiple APIs  (REST, SPARQL) Multiple querying  interfaces (e.g.,  relations network) Galaxy wrapper  available
  71. 71. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 71 Ontologies used in AgroLD 8 databases 37M triples 9 ontologies
  72. 72. Better ontology identification & selection  (via  ontology metadata) Multilingualism Ontology alignment (creation & use) Catching up with relevant data: annotations and linked data Generalized ontology‐based services  (keep quality while enabling horizontal studies) Scale  to multiple domain and to the number/variety of ontologies Challenges for  ontology  repositories Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 72
  73. 73. Scoring of  annotations  Improve the NCBO Annotator results by ranking the  annotations according to their relevance   While not changing the service implementation  Take into account their frequencies (as originally proposed in 2009 and  removed)  Add a term extraction measure, called C‐Value, used to positively  discriminate annotations generated from matches with multi‐word  terms.  Mostly improves annotations done with multiword terms  2 new scoring methods allowing to score and rank annotations  by their importance in the given input data  Interesting results validated against PubMed manual annotations S. Melzi & C. Jonquet. Scoring semantic annotations returned by the NCBO Annotator, In 7th International Semantic Web Applications and Tools for Life Sciences, SWAT4LS'14. Berlin, Germany, Dec. 2014. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 73
  74. 74. Improve the  workflow to  handle clinical  text narrative  Detecting Negation,  Temporality and Experiencer  Implementation using NegEx/ConText  Inclusion in the French/SIFR Annotator  Proxy architecture to plug this the NCBO  Annotator  Very good performance results  e.g., negation F1 between  0.8 and 0.9 Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 74
  75. 75. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 75 SIFR Annotator – semantic annotation of French biomedical text  with ontologies
  76. 76. Better ontology identification & selection  (via  ontology metadata) Multilingualism Ontology alignment (creation & use) Catching up with relevant data: annotations and linked data Generalized ontology‐based services  (keep quality while enabling horizontal studies) Scale  to multiple domain and to the number/variety of ontologies Challenges for  ontology  repositories Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 76
  77. 77. Scale to  multiple  domain and to  the  number/variety  of ontologies There are 596 ontologies and +110  ontology views in BioPortal right now  Mostly biology and medicine  Overlaps with other domains  Lots of upper level ontologies  Lots of vocabularies  AgroPortal, MMI Portal,  ESIP Portal, EcoPortal ?  Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 77
  78. 78. Mutualize  efforts  No repository (except the Web itself)  will handle them all, while keeping the level of features (and curation?)  Will each domain build they own technology?  Sharing the technology is the best way to guaranty long term  support and future development  Developers all around the world  Different funders & support  Sharing the technology is the best way to make ontology  repositories interoperable Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 78
  79. 79. Network of  interconnected  BioPortalS – a  few thoughts  UI does not really matter  We should be able to make a new portal for another community in minutes  Avoid duplicating ontologies  Connect portals one another  Through mappings as we did with translation mappings  The annotator proxy feature  Implement and discuss standards  SKOS handling in BioPortal  Ontology metadata description Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 79
  80. 80. Proxy service  architecture  Most of our new features are  developed within a proxy  E.g., we can call either the  AgroPortal, SIFR BioPortal  or even the NCBO  BioPortal Annotator and  use the same code to score  annotations  Used this to set up an  enhanced version of the  NCBO Annotator 80 Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
  81. 81. NCBO  Annotator +  A remote BioPortal UI  which actually talks to  the main BioPortal  REST API  Interesting for future  interoperable  BioPortal instances Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 81
  82. 82. Conclusion Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 82
  83. 83. Résumé  Importance des ontologies et des technologies  du Web sémantique pour les données FAIR  L’utilisation des ontologies pour l’annotation de  données restent la killer‐app  Etendre a d’autres type de donnés (multimédia) ?   D’autres processus d’annotation ou de liftage de  données ouvertes et liées  Des vrais challenges pour les portails d’ontologies  Besoin de fournir des outils/plateformes adaptées  à chaque communautés tout en gardant de la  généricité Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 83
  84. 84. Convergence  avec les travaux de l’INIST  Projet VisaTM: Offre de fouille de texte via OpenMinted  Vous emmenez les corpus (ISTEX) nous emmenons les ontologies  (AgroPortal)  Si on fait le boulot pour connecter la technologie NCBO a OpenMinted,  autant le réutiliser  Projet LOTERRE et ORHTOLANG   Ressources en OWL, SKOS… pourquoi pas essayer une instance de la  technologie NCBO ?  Harmoniser nos métadonnées  Partager nos efforts, passer à d’autres domaines, d’autres échelles.  GDR SemanDiv  AgroPortal, alignements entre thesaurus et ontologies  FAIR Data Management Plan   Aider a identification des ontologies adequate pour les données Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 84
  85. 85. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 85 http://bioportal.lirmm.fr/ontologies/ PSYCHOPATHO https://loterre‐ dev.inist.fr/Psychopathologies
  86. 86. Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 86 http://bioportal.lirmm.fr/annotator http://services.bioportal.lirmm.fr/annotator/?text=L'alcoolisme (ou l'alcoolodépendance) est un  type d'abus de substance mais il y a en général aucun signe de carence affective la dedans. &ontologies=PSYCHOPATHO &longest_only=true &negation=true &score=cvalue
  87. 87. Merci. Plus de slides ? jonquet@lirmm.fr Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 87
  88. 88. Create mappings  with external  mapping tool(s)  and then store  them in BioPortal Select ontologies to align (from  BioPortal or not) Align ontologies for instance with Yam++ Automatically export the results to  BioPortal Reuse mappings for annotation,  indexing and future mapping generation Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 106
  89. 89. AgroPortal mapping life cycle (work in progress) Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France 107

×