VP01 Intro Workshop Tilburg
Upcoming SlideShare
Loading in...5
×
 

VP01 Intro Workshop Tilburg

on

  • 580 views

door Saskia Woutersen, UvA

door Saskia Woutersen, UvA

Statistics

Views

Total Views
580
Views on SlideShare
579
Embed Views
1

Actions

Likes
0
Downloads
0
Comments
0

1 Embed 1

http://www.slideshare.net 1

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • Uitgangspunt: een publicatie moet een modulaire structuur hebben om deze te kunnen verrijken. Een verrijkte publicatie kent verschillende vormen.
  • Er bestaat echter ook een vorm van verrijking waarbij in een traditionele publicatie gebruik wordt gemaakt van XML . In dit geval is de traditionele publicatie geen onderdeel van een verzameling objecten, maar vindt de verrijking puur in de traditionele publicatie zelf plaats. Met XML is het mogelijk de semantiek van een artikel weer te geven. Je kunt aangeven waar de feiten, de probleemstelling, de hypothese, het empirisch bewijs, de analyse en de conclusie in de publicatie staan. Soms wordt wel gezegd dat de publicatie dan bestaat uit verschillende modulen of objecten. Deze modulen of objecten zijn dan voorzien van metadata. Door naast XML bovendien gebruik te maken van een ontologie, is het mogelijk kennis te koppelen aan gerelateerd feiten, publicaties, databases, etc. De ontologie beschrijft de entiteiten en de onderlinge relaties en regels binnen een bepaalde discipline. Sommige Markup Languages zijn dan ook verbonden aan bepaalde disciplines, bijv. Chemical Markup Language (CML); Mathematics Markup Language en Biology Markup Language . Deze taal (ontologie) helpt de informatie te vinden, bijvoorbeeld in databases. De structuur is namelijk niet alleen van belang voor de lezer, maar ook voor de machines. Data mining zal immers steeds belangrijker worden Structuur (Kircz) Van lineair naar modulaire publicatie, incl. Onderzoekgegevens + relatie/links naar andere modules/delen van het artikel
  • Elsevier heeft in de zomer van 2009 twee prototypen van verrijkte publicaties gepubliceerd ( http:// beta.cell.com / ) Auteurs wordt gevraagd wat zij van de nieuwe modellen vinden. De prototypen bevatten o.a. een hiërarchische presentatie van tekst en figuren, een grafisch abstract, audio en video geïntegreerd.
  • Prospect - Deze tools helpen om het artikel sneller te doorgronden en door definities te geven en relevante artikelen op te sommen. Informatie/semantiek Royal Society of Chemistry Project Prospect Ontology Terms Feature: 1. gemarkeerde termen 2. gedetaileerde informatie 3. relevante publicaties
  • Beter, sneller te berijgpen voor mens en machine
  • Van der Poel Meestal wordt dit type van een verrijkte publicatie gezien als het samenbrengen van gerelateerde objecten onder één metadata record. Aan de traditionele publicatie worden bijvoorbeeld datasets, video’s, etc. gelinkt. Nature heeft een speciale website Nature Multimedia met streaming video’s, pod casts, blogs en tools . Maar vanaf de video’s wordt niet verwezen naar de publicatie: de lezer van het artikel weet niets van de video, en de kijker van de video niet van het bestaan van het artikel.
  • Publicaties van uitgevers zijn slechts beperkt verrijkt. Ze zijn voorzien van hyperlinkt referenties en soms van bijlagen. Elsevier en Blackwell bieden onderzoeksdata aan bij de publicatie. Helaas betreft het meestal PDFs en zelden ruwe onderzoeksdata.
  • De Public Library of Science (PloS) is de enige uitgever die de mogelijkheid biedt om na het verschijnen gegevens toe te voegen, zowel commentaar, rankings, als trackbacks.
  • Indien er wordt voortgebouwd op het onderzoek in een verrijkte publicatie, moet de publicatie zoals die ten tijde van de citatie beschikbaar was, ook in de toekomst voor collega-onderzoekers beschikbaar zijn. Van de objecten die een onderdeel vormen van de verrijkte publicatie moet bovendien zeker zijn om welk object het gaat, en ook dat het object niet is veranderd.
  • Om de interoperabiliteit te waarborgen is gebruik van een ontologie noodzakelijk . Elsevier, Wiley, Springer, Nature, etc. Supplementary materials maar problemen met: geen wederzijdse relatie toegang duurzaam omvang
  • Er is in ieder geval een uitgever, de American Astronomical Society (AAS), die op een juiste manier verwijst naar externe bronnen. De AAS eist voor iedere dataset een unieke en permanente identifier. Alle astronomische data centra kennen deze unieke identifiers toe aan iedere gewenste set. De data centra zijn overeengekomen de identifiers tot in de lengte der dagen toegankelijk te houden.
  • De delen van een verrijkte publicatie moeten daarom zorgvuldig worden geselecteerd. Verrijkte publicaties of onderdelen daarvan moeten daarom aan de volgende voorwaarden voldoen: Het is eenvoudig te controleren of twee objecten hetzelfde zijn, maar bij (grote) datasets kan dat ingewikkeld zijn. Data-correctie, -updates, en -onderhoud kunnen bovendien de data beïnvloeden. Om te garanderen en onafhankelijk te kunnen controleren dat de dataset niet is veranderd, zelfs niet als het formaat is veranderd, kan de Universal Numeric Fingerprint (UNF) worden gebruikt. UNF is een digitale sleutel (een korte rij getallen en karakters) die uit de inhoud van een dataset wordt gegenereerd, zodanig dat een enkele wijziging in een andere UNF resulteert.
  • De digitale objecten en de links vormen als geheel de verrijkte publicatie.
  • To handle this complex process, only the OAI-ORE model is sufficient
  • Scientific Publication Package (SPP) - experimenten eenvoudig te herhalen, controleren en verspreiden In de pakketten worden de stappen van het wetenschappelijk onderzoek vastgelegd. Zo kan duidelijk worden gemaakt hoe de data en andere resultaten van onderzoek (bijv. de publicatie) tot stand zijn gekomen. Deze manier van beschrijven maakt het mogelijk de experimenten eenvoudig te herhalen, controleren en verspreiden. Fouten, anomalieën, e.d. zijn dan gemakkelijker te achterhalen. Aan het eind van het wetenschappelijk proces publiceert de wetenschapper zijn/haar SPP. Alle componenten worden voorzien van een unieke identifier. Een SPP bestaat uit data (database gegevens, beelden, visualisaties, grafieken), functies, software, specificaties, publicaties (Endnote files, rapporten, documentatie etc.). Het samengesteld digitaal object wordt opgeslagen als RDF pakket. De relaties tussen de objecten worden duidelijk door de metadata gebruikte ontologie of pakketgebonden specificaties. De SPP kan in een repository worden geplaatst en aldaar worden geïndexeerd, uitgewisseld, hergebruikt, vergeleken en geïntegreerd.
  • Repositories have an infrastructure that is very well suited to collect, to make accessible & archive scholarly output U niversities and research institutes should take the responsibility to archive the digital scholarly output of their organisation in a sustainable way.
  • Redenen om verrijkte publicaties samen te stellen kunnen zijn (1), (2) (3). Scientific Publication Package (SPP) experimenten eenvoudig te herhalen, controleren en verspreiden componenten - unieke identifier. data (database gegevens, beelden, visualisaties, grafieken) functies, software, specificaties publicaties (Endnote files, rapporten, documentatie etc.). samengesteld digitaal object - RDF pakket. relaties metadata gebruikte ontologie pakketgebonden specificaties. SPP in een repository geïndexeerd, uitgewisseld, hergebruikt, vergeleken en geïntegreerd. In de pakketten worden de stappen van het wetenschappelijk onderzoek vastgelegd. Zo kan duidelijk worden gemaakt hoe de data en andere resultaten van onderzoek (bijv. de publicatie) tot stand zijn gekomen. Deze manier van beschrijven maakt het mogelijk de experimenten eenvoudig te herhalen, controleren en verspreiden. Fouten, anomalieën, e.d. zijn dan gemakkelijker te achterhalen. Aan het eind van het wetenschappelijk proces publiceert de wetenschapper zijn/haar SPP. Alle componenten worden voorzien van een unieke identifier. Een SPP bestaat uit data (database gegevens, beelden, visualisaties, grafieken), functies, software, specificaties, publicaties (Endnote files, rapporten, documentatie etc.). Het samengesteld digitaal object wordt opgeslagen als RDF pakket. De relaties tussen de objecten worden duidelijk door de metadata gebruikte ontologie of pakketgebonden specificaties. De SPP kan in een repository worden geplaatst en aldaar worden geïndexeerd, uitgewisseld, hergebruikt, vergeleken en geïntegreerd.

VP01 Intro Workshop Tilburg VP01 Intro Workshop Tilburg Presentation Transcript

  • Wat is een Verrijkte publicatie? Saskia Woutersen-Windhouwer (UvA) Universiteitsbibibliotheek
  • Inhoud
    • Waarom?
    • Wat is een verrijkte publicatie?
      • 1. Verrijking in de publicatie
      • 2. Verrijking met de publicatie
    • Spelers
    • Aandachtspunten
    • Conclusie
    • Vragen
  • Waarom?
    • Nieuwe publicatievormen
      • video’s, databases, datasets,etc.
        • moeilijk te vinden
        • impact neemt toe
    • Semantic web
  • Wat is een verrijkte publicatie?
    • Gerelateerde wetenschappelijke gegevens
    • Gestructureerd samengebracht
      • duidelijk semantiek
    • Twee typen
  • 1e type: Verrijking in de publicatie
    • eXtensible Markup Language (XML)
    <scientific_article_deep_structure> <fact>... </fact> ... ( new phenomena ) <problem> ... </problem> ( question ) <method> <methodology> ... </methodology> </method> <hypotheses> ( provisory answer ) <contextual_condition> ... </ contextual_condition >
  •  
  •  
  • Samenvatting verrijking in de publicatie
    • XML
      • Vorm : beschrijft entiteiten, onderlinge relaties en regels
        • modulen, objecten voorzien van metadata
        • feiten, probleemstelling, hypothese, empirisch bewijs, analyse en conclusie
      • Kennis : koppelt kennis aan gerelateerd feiten, publicaties, databases; vindt bijv. informatie in databases
    • Ontologie
        • algemeen (vorm)
        • discipline specifiek, bijv. Chemical Markup Language (CML)
  • 2e type: verrijking met de publicatie
    • Onderdelen:
    • Traditionele publicatie
        • voornamelijk tekst
    • Onderzoekgegevens
        • bewijsmateriaal (bijv. datasets), maar ook onderdelen van het onderzoek zelf (bijv. enquêtes)
    • Extra materialen
        • ter illustratie of verduidelijking (foto’s, video’s)
    • Post publicatie gegevens
        • comments, ranking
  •  
  •  
  • Examples of Enhanced publications
  •  
    • PLoS
  • Bronnen
    • Uitgever(s)
    • Repositories
    • SciVee
    • Blog
    • Wiki
    • Etc.
  • Traditie wetenschappelijk publiceren
    • Controleerbaar
    • Onveranderlijk
    • Geldt voor zowel:
      • verrijkte publicatie als geheel
      • onderdelen van een verrijkte publicatie
  • Repositories
    • Ontologien/structuur
    • Interoperabiliteit
    • Duurzaamheid
    • Opslagcapaciteit
    • Toegang
  • Een goed voorbeeld
    • American Astronomical Society (AAS)
    • Overeenkomst tussen uitgever en alle astronomische data centra
      • unieke identifiers
      • aan iedere gewenste set
      • lengte der dagen toegankelijk
  • Selectiecriteria (delen) VP
    • Reguliere uitgever of een trusted repository
    • Persistent identifier (incl. resolver )
    • Datumstempel
    • Regulier filetypen
    • Goede kwaliteit (voor preservering)
    • Datasets incl. Universal Numeric Fingerprint
    • Citeerbaar
    • Legaal (niet alleen in relatie met auteursrecht)
  • Relaties digitale objecten + relaties = verrijkte publicatie
  • Enhanced publication model: OAI-ORE
    • Relaties tussen publicatie en relevante objecten
        • data, websites, commentaries, etc.
    • De links geven het type relatie weer tussen de objecten
        • Is it a ‘part of’ (like a chapter of a book) or a ‘comment on’?
    • Een verrijkte publicatie kan in de tijd veranderen
        • het model kan continue worden aangevuld.
    • Modellen voor publicatie typen zijn/worden gemaakt
        • boek, artikel, etc.
  • Resultaat
      • nieuwe inzichten verkrijgen door nieuwe combinaties
      • voor het gemak (alle relevante materialen bij elkaar)
      • een verzameling van digitale objecten als resultaat van het onderzoeksproces
        • Bijv. Scientific Publication Package (SPP)
  • Spelers
    • Onderzoekers
      • inhoud
    • Uitgevers/repositories
      • diensten en tools voor verrijkte publicaties
    • Universiteiten
      • archiveren
  • Aandachtspunten
    • Meer relaties
    • (Meer) tools!
    • Samenwerking
  • Conclusie
    • Beheersbaar houden wetenschappelijke output
    • Samenbrengen van gerelateerde informatie
    • Semantische relaties
    • Aan elkaar gerelateerde objecten zijn:
        • Eenvoudig te vinden
        • Gemakkelijk toegankelijk
        • Eenvoudig te gebruiken
    • Maakt het wetenschappelijk publiceren leuker en meer efficiënt!
  • Vragen?
  • Scientific Publication Package (SPP)
    • Experimenten herhalen, controleren en verspreiden
    • Componenten (met unieke identifier)
        • data (database gegevens, beelden, visualisaties, grafieken)
        • functies, software, specificaties
        • publicaties (Endnote files, rapporten, documentatie etc.).
        • samengesteld digitaal object - RDF pakket.
    • Relaties
        • metadata gebruikte ontologie
        • pakketgebonden specificaties.
    • SPP wordt in een repository geïndexeerd, uitgewisseld, hergebruikt, vergeleken, geïntegreerd