Persistente Identifiers Hennie Brugman Technical coordinator CATCHPlus
Samenvatting Wat is eigenlijk het probleem? De basisoplossing Wat is er beschikbaar: voorbeelden van persistente identifiers Wat doet CATCHPlus? Zelf toepassen van persistente identifiers Welke keuzen? Stappen? Consequenties? Kansen?
Probleem:  Steeds meer digitale objecten, met steeds meer identifiers In web context: identifier = URL Steeds vaker extern aangeboden (web)
Probleem: Steeds meer verwijzingen Web links Contextualisering Samenwerkingsverbanden Virtuele collecties en tentoonstellingen
Probleem: Identifiers zijn vaak niet uniek
Probleem: Identifiers zijn vaak niet persistent Verwijzingen worden makkelijk ongeldig
Probleem  object_1 new_object_1 http://.../object_1
Basisoplossing  Ontkoppel naam/identifier en locatie(s) Registreer combinaties van identifiers met locaties in een tabel Externe referenties gebruiken de identifier
Basisoplossing  object_1 new_object_1 id1 http://.../object_1 id1
Basisoplossing  new_object_1 id1 http://.../new_object_1 id1
Resolver dienst  new_object_1 id1 “ wat is huidige URL voor id1?” “ http://.../new_object_1” GET http://.../new_object_1 web-pagina
Naming Authority Naming Authority: beheerder van de inhoud van de tabel NA heeft ook een unieke persistente identifier Globaal geregistreerd waar de resolver voor de NA is te vinden. Veel soorten persistente identifiers hebben de basisvorm:  <unieke-id-van-NA><unieke-locale-id>
Naming Authority Global repository NA1 NA2 NA3 id-van-NA   adres van resolver voor NA id-van-object   adres van object
Global resolving Global repository NA3 id1 new_object_1 Local repository Local repository
Voorbeelden van PID oplossingen Er bestaan een aantal verschillende oplossingen Binnen erfgoed in NL spelen een rol Gewoon URLs gebruiken URN-NBN  Handles DOI ARK PURL
http URL  http://identifiers.erfgoed.nl/local_id_1821 URN-NBN   urn:nbn:nl-local_id_1821 Handles   10574/local_id_1821  http://hdl.handle.net/10574/local_id_1821 DOI   doi:10.1594/PANGAEA.726855   http://dx.doi.org/10.1594/PANGAEA.726855 ARK   http://identifiers.erfgoed.nl/ark:/128014/local_id_1821 PURL   http://purl.org/vocabularies/iconclass/concept1821
http URL  http://identifiers.erfgoed.nl/local_id_1821 URN-NBN   urn:nbn:nl-local_id_1821 Handles   10574/local_id_1821  http://hdl.handle.net/10574/local_id_1821 DOI   doi:10.1594/PANGAEA.726855   http://dx.doi.org/10.1594/PANGAEA.726855 ARK   http://identifiers.erfgoed.nl/ark:/128014/local_id_1821 PURL   http://purl.org/vocabularies/iconclass/concept1821 HOST NA LOCAL ID X X X
Mogelijke selectie-criteria(1) Software ondersteuning Goede resolving oplossing voorhanden Die is beproefd, stabiel en 100% betrouwbaar Schaalbaar, met betrekking tot Aantallen identifiers Performance Werkt globaal Ook delen van objecten te identificeren Metadata te associëren met identifiers “ actionable”: (ook) dmv http URLs te resolven Ook ondersteuning voor identifier-beheerfuncties
Mogelijke selectie-criteria (2) Identifier beheer Beheer van identifiers onafhankelijk van Systeembeheer Web server beheer Hosting van resolverdiensten Beheer vanuit collectie beheer systeem mogelijk B.v. door verantwoordelijke collectiebeheerder Beheer is eenvoudig en efficient
Mogelijke selectie-criteria (3) Organisatie en beleid Welke keuzes maken partner-instellingen? Betrouwbaarheid en duurzaamheid van de dienstverleners Beperkte en beheersbare kosten Vrijheid om te switchen van dienstverlener
Wat doet CATCHPlus? Technisch Local Handle System(s) REST web service voor resolving en PID beheer Web-prototype voor PID-beheer functionaliteit Toepassen in enkele pilot-projecten Organisatie en beleid Duurzame hosting en dienstverlening Informatie verstrekken “ tussenpersoon” Tussen erfgoedinstellingen en –projecten CATCH/CATCHPlus en andere NL en EU PID initiatieven Streven naar bundeling van erfgoedbelangen
Wat doet CATCHPlus? Technisch Local  Handle  Systems REST web service voor resolving en PID beheer Web-prototype voor PID-beheer functionaliteit Toepassen in enkele pilot-projecten Organisatie en beleid Duurzame hosting en dienstverlening Informeren Tussenpersoon Streven naar bundeling van erfgoedbelangen Voldoet als enige aan alle criteria mbt  software ondersteuning Eerste pilot (B en G): prefix voor NA aangevraagd en Local Handle System geïnstalleerd bij/door SARA Kosten: 50 dollar, plus 50 dollar per jaar
Wat doet CATCHPlus? Technisch Local Handle Systems REST web service  voor resolving en PID beheer Web-prototype voor  PID-beheer user interface Toepassen in enkele pilot-projecten Organisatie en beleid Duurzame hosting en dienstverlening Informeren Tussenpersoon Streven naar bundeling van erfgoedbelangen Web service Resolving, aanmaken en beheer van Handles SARA bouwt eerste versie in opdracht van CATCHPlus User interface Prototype tbv evaluatie door collectie-beheerders Implementatie door bedrijfsleven
Wat doet CATCHPlus? Technisch Local Handle Systems REST web service voor resolving en PID beheer Web-prototype voor PID-beheer functionaliteit Toepassen in enkele  pilot-projecten Organisatie en beleid Duurzame hosting en dienstverlening Streven naar bundeling van erfgoedbelangen Informeren Tussenpersoon Toekennen van persistente identifiers aan: Concepten in de Vocabulary Repository Deelcollectie van Beeld en Geluid Interesse vanuit diverse andere erfgoedinstellingen en -projecten
Wat doet CATCHPlus? Technisch Local Handle Systems REST web service voor resolving en PID beheer Web-prototype voor PID-beheer functionaliteit Toepassen in enkele pilot-projecten Organisatie en beleid Duurzame hosting en dienstverlening Streven naar  bundeling van erfgoedbelangen Informeren Tussenpersoon EPIC  (European Persistent Identifier Consortium) SARA (NL), CSC (Finland), GWDG (DLD), … (intentie tot aanbieden van) redundante en betrouwbare PID diensten tbv wetenschap en erfgoed Op basis van Handles Stakeholders kunnen deelnemen aan bestuur en o.m. meebeslissen over business model Europese mirror van de z.g. Global Handle Repository
Toepassen van persistente identifiers Keuzen? Stappen? Consequenties? Kansen?
Keuzen Welke objecten krijgen een persistente identifier toegekend?  (versies, samenstellingen, verschillende formaten, ...) Wat is de relatie van die identifier met mogelijk al bestaande identifiers?  Wat is het formaat van de aan te maken PIDs?  (CoolURI?) Naar welke “landingspagina” wordt de PID geresolved? Welke informatie hoort daar wel en niet op? Verantwoordelijkheden voor creatie en beheer Welke garanties mbt persistentie kunnen gegeven worden, en hoe kan dat worden waargemaakt? Oplossing voor hosting en dienstverlening
Stappen Voor bestaande objecten Beleidskeuzen maken Bepaal URLs voor “landingspagina’s” Maak en publiceer PIDs Sla die PIDs locaal op, geassocieerd met/in plaats van intern object id Vervang referenties op basis van interne id’s door referenties op basis van PIDs Voor nieuwe objecten en collectiebeheer Integreer PID-creatie en -beheer in collectiebeheer-workflows en –tools
Consequenties Externe beschikbaarheid data en diensten afhankelijk van één cruciale dienst (mag dus geen ‘single point of failure’ zijn!) Identifier management wordt een expliciete taak Commitment mbt persistentie moet worden waargemaakt Tool-support voor PID management moet worden geregeld (anders te arbeidsintensief en foutgevoelig) Intern (re-)organiseren van data wordt eenvoudiger Aanbieden digitale collectie aan derden wordt eenvoudiger, consistenter en duurzamer (zeker i.c.m OAI)
Kansen Mede vormgeven aan PID dienstverlening en de voorwaarden waaronder dat gebeurt Voortrekkersrol mbt publiceren museale collecties op internet Samenwerking met andere erfgoedinstellingen Minder eilandjes Betere gezamenlijke belangenbehartiging Kennis delen
Vragen?

Introductie Persistente Identifiers

  • 1.
    Persistente Identifiers HennieBrugman Technical coordinator CATCHPlus
  • 2.
    Samenvatting Wat iseigenlijk het probleem? De basisoplossing Wat is er beschikbaar: voorbeelden van persistente identifiers Wat doet CATCHPlus? Zelf toepassen van persistente identifiers Welke keuzen? Stappen? Consequenties? Kansen?
  • 3.
    Probleem: Steedsmeer digitale objecten, met steeds meer identifiers In web context: identifier = URL Steeds vaker extern aangeboden (web)
  • 4.
    Probleem: Steeds meerverwijzingen Web links Contextualisering Samenwerkingsverbanden Virtuele collecties en tentoonstellingen
  • 5.
  • 6.
    Probleem: Identifiers zijnvaak niet persistent Verwijzingen worden makkelijk ongeldig
  • 7.
    Probleem object_1new_object_1 http://.../object_1
  • 8.
    Basisoplossing Ontkoppelnaam/identifier en locatie(s) Registreer combinaties van identifiers met locaties in een tabel Externe referenties gebruiken de identifier
  • 9.
    Basisoplossing object_1new_object_1 id1 http://.../object_1 id1
  • 10.
    Basisoplossing new_object_1id1 http://.../new_object_1 id1
  • 11.
    Resolver dienst new_object_1 id1 “ wat is huidige URL voor id1?” “ http://.../new_object_1” GET http://.../new_object_1 web-pagina
  • 12.
    Naming Authority NamingAuthority: beheerder van de inhoud van de tabel NA heeft ook een unieke persistente identifier Globaal geregistreerd waar de resolver voor de NA is te vinden. Veel soorten persistente identifiers hebben de basisvorm: <unieke-id-van-NA><unieke-locale-id>
  • 13.
    Naming Authority Globalrepository NA1 NA2 NA3 id-van-NA  adres van resolver voor NA id-van-object  adres van object
  • 14.
    Global resolving Globalrepository NA3 id1 new_object_1 Local repository Local repository
  • 15.
    Voorbeelden van PIDoplossingen Er bestaan een aantal verschillende oplossingen Binnen erfgoed in NL spelen een rol Gewoon URLs gebruiken URN-NBN Handles DOI ARK PURL
  • 16.
    http URL http://identifiers.erfgoed.nl/local_id_1821 URN-NBN urn:nbn:nl-local_id_1821 Handles 10574/local_id_1821 http://hdl.handle.net/10574/local_id_1821 DOI doi:10.1594/PANGAEA.726855 http://dx.doi.org/10.1594/PANGAEA.726855 ARK http://identifiers.erfgoed.nl/ark:/128014/local_id_1821 PURL http://purl.org/vocabularies/iconclass/concept1821
  • 17.
    http URL http://identifiers.erfgoed.nl/local_id_1821 URN-NBN urn:nbn:nl-local_id_1821 Handles 10574/local_id_1821 http://hdl.handle.net/10574/local_id_1821 DOI doi:10.1594/PANGAEA.726855 http://dx.doi.org/10.1594/PANGAEA.726855 ARK http://identifiers.erfgoed.nl/ark:/128014/local_id_1821 PURL http://purl.org/vocabularies/iconclass/concept1821 HOST NA LOCAL ID X X X
  • 18.
    Mogelijke selectie-criteria(1) Softwareondersteuning Goede resolving oplossing voorhanden Die is beproefd, stabiel en 100% betrouwbaar Schaalbaar, met betrekking tot Aantallen identifiers Performance Werkt globaal Ook delen van objecten te identificeren Metadata te associëren met identifiers “ actionable”: (ook) dmv http URLs te resolven Ook ondersteuning voor identifier-beheerfuncties
  • 19.
    Mogelijke selectie-criteria (2)Identifier beheer Beheer van identifiers onafhankelijk van Systeembeheer Web server beheer Hosting van resolverdiensten Beheer vanuit collectie beheer systeem mogelijk B.v. door verantwoordelijke collectiebeheerder Beheer is eenvoudig en efficient
  • 20.
    Mogelijke selectie-criteria (3)Organisatie en beleid Welke keuzes maken partner-instellingen? Betrouwbaarheid en duurzaamheid van de dienstverleners Beperkte en beheersbare kosten Vrijheid om te switchen van dienstverlener
  • 21.
    Wat doet CATCHPlus?Technisch Local Handle System(s) REST web service voor resolving en PID beheer Web-prototype voor PID-beheer functionaliteit Toepassen in enkele pilot-projecten Organisatie en beleid Duurzame hosting en dienstverlening Informatie verstrekken “ tussenpersoon” Tussen erfgoedinstellingen en –projecten CATCH/CATCHPlus en andere NL en EU PID initiatieven Streven naar bundeling van erfgoedbelangen
  • 22.
    Wat doet CATCHPlus?Technisch Local Handle Systems REST web service voor resolving en PID beheer Web-prototype voor PID-beheer functionaliteit Toepassen in enkele pilot-projecten Organisatie en beleid Duurzame hosting en dienstverlening Informeren Tussenpersoon Streven naar bundeling van erfgoedbelangen Voldoet als enige aan alle criteria mbt software ondersteuning Eerste pilot (B en G): prefix voor NA aangevraagd en Local Handle System geïnstalleerd bij/door SARA Kosten: 50 dollar, plus 50 dollar per jaar
  • 23.
    Wat doet CATCHPlus?Technisch Local Handle Systems REST web service voor resolving en PID beheer Web-prototype voor PID-beheer user interface Toepassen in enkele pilot-projecten Organisatie en beleid Duurzame hosting en dienstverlening Informeren Tussenpersoon Streven naar bundeling van erfgoedbelangen Web service Resolving, aanmaken en beheer van Handles SARA bouwt eerste versie in opdracht van CATCHPlus User interface Prototype tbv evaluatie door collectie-beheerders Implementatie door bedrijfsleven
  • 24.
    Wat doet CATCHPlus?Technisch Local Handle Systems REST web service voor resolving en PID beheer Web-prototype voor PID-beheer functionaliteit Toepassen in enkele pilot-projecten Organisatie en beleid Duurzame hosting en dienstverlening Streven naar bundeling van erfgoedbelangen Informeren Tussenpersoon Toekennen van persistente identifiers aan: Concepten in de Vocabulary Repository Deelcollectie van Beeld en Geluid Interesse vanuit diverse andere erfgoedinstellingen en -projecten
  • 25.
    Wat doet CATCHPlus?Technisch Local Handle Systems REST web service voor resolving en PID beheer Web-prototype voor PID-beheer functionaliteit Toepassen in enkele pilot-projecten Organisatie en beleid Duurzame hosting en dienstverlening Streven naar bundeling van erfgoedbelangen Informeren Tussenpersoon EPIC (European Persistent Identifier Consortium) SARA (NL), CSC (Finland), GWDG (DLD), … (intentie tot aanbieden van) redundante en betrouwbare PID diensten tbv wetenschap en erfgoed Op basis van Handles Stakeholders kunnen deelnemen aan bestuur en o.m. meebeslissen over business model Europese mirror van de z.g. Global Handle Repository
  • 26.
    Toepassen van persistenteidentifiers Keuzen? Stappen? Consequenties? Kansen?
  • 27.
    Keuzen Welke objectenkrijgen een persistente identifier toegekend? (versies, samenstellingen, verschillende formaten, ...) Wat is de relatie van die identifier met mogelijk al bestaande identifiers? Wat is het formaat van de aan te maken PIDs? (CoolURI?) Naar welke “landingspagina” wordt de PID geresolved? Welke informatie hoort daar wel en niet op? Verantwoordelijkheden voor creatie en beheer Welke garanties mbt persistentie kunnen gegeven worden, en hoe kan dat worden waargemaakt? Oplossing voor hosting en dienstverlening
  • 28.
    Stappen Voor bestaandeobjecten Beleidskeuzen maken Bepaal URLs voor “landingspagina’s” Maak en publiceer PIDs Sla die PIDs locaal op, geassocieerd met/in plaats van intern object id Vervang referenties op basis van interne id’s door referenties op basis van PIDs Voor nieuwe objecten en collectiebeheer Integreer PID-creatie en -beheer in collectiebeheer-workflows en –tools
  • 29.
    Consequenties Externe beschikbaarheiddata en diensten afhankelijk van één cruciale dienst (mag dus geen ‘single point of failure’ zijn!) Identifier management wordt een expliciete taak Commitment mbt persistentie moet worden waargemaakt Tool-support voor PID management moet worden geregeld (anders te arbeidsintensief en foutgevoelig) Intern (re-)organiseren van data wordt eenvoudiger Aanbieden digitale collectie aan derden wordt eenvoudiger, consistenter en duurzamer (zeker i.c.m OAI)
  • 30.
    Kansen Mede vormgevenaan PID dienstverlening en de voorwaarden waaronder dat gebeurt Voortrekkersrol mbt publiceren museale collecties op internet Samenwerking met andere erfgoedinstellingen Minder eilandjes Betere gezamenlijke belangenbehartiging Kennis delen
  • 31.