Sanja Halling Standarder och aggregering NM 2012 01-15
1. Workshop om digitalisering
Sanja Halling
Digisam – Samordningssekretariatet för digitalisering, digitalt
bevarande och digitalt tillgängliggörande av kulturarvet
Nationalmuseum, den 15 januari 2013
3. Överkurs eller rimligt krav?• traditionella funktioner för tillgängliggörandet av
information har ändrats
• nya metoder, verktyg och teknik
• teoretiska och praktiska verktyg samt insikt om
förändringarna
• robusta digitala infrastrukturer
• chansen att föra samman kulturarv som har
splittrats genom olika typer av kategoriseringar
och pröva nya tekniker och metoder
= Digitala utställningar, tematiska och med
pedagogiskt uppbyggt innehåll, digitala
rundvandringar
4. Digitala/Virtuella utställningar• verktyg för att visa kulturarv och presentera samlingar
• digitala berättelser genom effektiv grafisk design och
användning av flera medier
• kan gå bortom fysiska gränser
– når bredare publik, även flerspråkiga användare
– samverkan med turistsektorn = nya användare
• interaktion med användare möjlig, t ex UGC.
• teknik som ett medel att berika innehållet, så att det
kulturella budskapet har företräde framför användning av
själva tekniken
– system som möjliggör att berika online-innehåll och tjänster över tid.
– digitala infrastrukturer erbjuder hög kapacitet och tjänster som
institutionerna inte har råd med internt - potentialen i samarbetet.
5. En samling av digitala objekt utgör inte en digital
utställning. Det är endast när objekten är noggrant
utvalda för att illustrera ett ämne, och knyts samman till
en berättelse som det blir en utställning, "innehållet i ett
sammanhang."
En arbetsgrupp om virtuella utställningar inom ramen för
Linked Heritage-projektet kommer att undersöka hur
man kan förbättra kvaliteten på metadata
i virtuella utställningar.
Kan digitala museer eller digitala
bibliotek anses vara digitala
utställningar?
6. Vad vet vi om våra användare?• Digitala webbutställningar har inte experter eller
redan etablerade besökare som målgrupp utan
en publik som är större och mer heterogen
• Virtuella utställningar kan också ses av personer
med funktionsnedsättningar som inte har
möjlighet att besöka den fysiska utställningen.
• En möjlig världspublik!
13. ATHENA PLUS, Access to cultural heritage
networks for Europeana
• De viktigaste mål för projektet är att:
– tillföra kulturarvsportalen Europeana stora mängder
nytt material från både offentlig och privat sektor
– förbättra sökning, åtkomst och återanvändning av
innehållet i Europeana, förbättra hantering av
flerspråkiga terminologier
– experimentera med att berika metadata och
återanvända den anpassad till användarnas olika
behov (turister, skolor, forskare).
14. • 41 partners (21 länder): kompetenscentra,
ministerier, kulturarvsinstitutioner,
bibliotek, arkiv, museer, forskningscentra,
universitet m m.
• 3,8 millioner metadataposter) från mer än
540 kulturarvsinstitutioner (mer än 80%
museer).
15. DC-NET: Projektet hade som mål att främja den digitala
infrastrukturen för att ge tillgång till forskningsinformation från
kulturarvssektorn inom EU – sektorsövergripande samverkan.
INDICATE: internationellt samarbete, fallstudier, piloter.
DCH-RP: (Digital Cultural Heritage Roadmap for Preservation)
syftar till att producera och validera en ”Roadmap for
Preservation”, som beskriver på vilket sätt man bör gå tillväga
för att bevara det digitala kulturarvet genom en samlad e-
infrastruktur.
Priorities and
programming
Support and
demonstration
Roadmap for
preservation
16. Best practices och rekommendationer
Nyskapande tjänster och verktyg som stödjer tillhandahållandet
av det digitala kulturarvet.
17. DC-NET: services priority ordering
for Content Providers
1. Long-term preservation
2. Persistent identifiers
3. Interoperability and Aggregation
4. Advanced search
5. Data resource set-up
6. User authentication and access control
7. IPR and digital rights management
18. http://www.indicate-project.eu/
• INDICATE (International Network for
a Digital Cultural Heritage e-
Infrastructure) is an European
Union FP7 project which aims to
establish a network of common
interest made up of experts and
researchers in the field of e-
infrastructures and digital cultural
heritage at Euro Mediterranean
level.
• Through the network, the
participants can share experience,
promote standards and guidelines,
seek harmonisation of best practice
and policy.
19. • http://exhibitions.europeana.eu/
• http://www.lascaux.culture.fr/?lng=en
• http://www.v-must.net/
V-MusT is a EU FP7-funded network of excellence that aims to provide the heritage sector with
the tools and support to develop virtual museums that are educational, enjoyable, long-lasting
and easy to maintain
22. Hur skapas metadata?
Vanligtvis sker skapandet av metadata i institutionernas
egna verksamhetssystem.
Samlingsdata består ofta av:
– Information som registreras och hanteras i verksamheten, t ex
förvärv, lån, rättigheter, m m
– Föremålsbeskrivningar, t ex: typ, titel, material, dimensioner, m
m
– Händelser kring föremålet, t ex uppkomst, utgrävningsdata, m m
– Personer, organisationer och platser (ofta relaterade till
händelser)
Nyckelbegrepp för samlingsmetadata i dessa system är:
– Hög granularitet
– Specifika system (interna eller anpassningar av standarder)
• Institutionsspecifika
• Domänspecifika
• Landsspecifika
– Bevarandeaspekten
23. Museisystem
Olika slags musiesystem för förvaltning av
samlingar: Primus, MuseumPlus, Carlotta, Sofie,
Collective Access, TMS, egenutvecklade
system, m m
Nya funktionella och tekniska krav på system, bl a
stöd för vedertagna standarder
• Collections Trust CMS Software Survey 2012-
2013
http://www.collectionslink.org.uk/softwaresurvey
24. Metadatastandarder• Det finns en mängd olika typer av metadatastandarder som
används av kulturarvsinstitutioner. De kan klassificeras i:
– Describing standards (beskrivande standarder, baseras på
Dublin Core), ursprungligen för webbresurser (dokument). De
som använder Dublin Core använder ofta också andra
standarder vilket innebär att Dublin Core i praktiken ofta fungerar
som en sekundär standard.
– Information schemes (metadata): domänspecifika; för museer,
bibliotek, arkiv, m m.
– Tekniska standarder av teknisk, icke-beskrivande karaktär,
några konceptuella
– ”Harvesting-schema”-standarder. I museisektorn är LIDO
ledande ”skörd-schema”, medan bilden är mer varierad i
biblioteks- och arkivsektorn.
25. Beskrivande standarder
Domänspecifika:
Arkiv:
− EAD och ISAD (G) används båda, men är inte lämpliga för data från de andra
sektorerna.
Bibliotek:
− Olika specifikationer för MARC, liksom MODS.
− RDA (Resource Description and Access) modellen för att hantera semantisk webb
och länkade databehov.
Museer:
− Ett antal beskrivande metadata standarder används bl a: CDWA, LIDO, museumdat,
Object ID, VRA och SPECTRUM (SPECTRUM är både en beskrivande standard och
en processuell standard.
− LIDO byggdes på CDWA, museumdat och SPECTRUM . Därför kan man säga att
dessa tre standarder är kompatibla med och kan presenteras i LIDO.
− LIDO är en tillämpning av CIDOC CRM som är den enda ISO-certifierade
standarden för kulturarvsdata. CIDOC CRM är också en konceptuell modell.
− Inom museisektorn finns det idag en stor variation i användningen av
metadatastandarder. Oavsett vilken standard som finns i systemet kan museernas
metadata oftast aggregeras i LIDO.
26. Konceptuella standarder:
Museer:
• CIDOC CRM
CIDOC Conceptual Reference Model (CRM) antogs
formellt som en internationell standard (ISO-standard)
antogs formellt den 12 september 2006.
Bibliotek:
• FRBR
FRBR Functional Requirements for bibliographic records:
Mycket arbete har redan gjorts för att harmonisera de båda
modellerna, och de relevanta begreppen från FRBR-
modellen integrerades i CIDOC CRM-modellen. En
liknande insats pågår inom och i dialog med arkivsektorn.
CIDOC CRM kan ses som den ledande konceptuella
referensmodellen för kulturarvet.
27. Tekniska standarder (icke-
beskrivande):
• METS, en teknisk, icke-beskrivande modell som återspeglar
strukturen av ett digitalt objekt. Den används ofta i kombination med
andra modeller.
• Det gäller att säkra att både kunna förstå och återsöka
informationen, idag och i framtiden. För det behövs kunskap om
innehållet, i form av tekniska metadata, men också om struktur och
kontext, ”paket” med metadata som beskriver både hur
informationen ska läsas och hur den tekniska miljön som den
skapades i såg ut, dvs man säkrar äkthetsbevarande och
bevarande av kontext.
29. Hur tillgängliggörs metadata?
Metadata i webbformat – via söktjänster, som t ex Kringla och Europeana
– http://www.kringla.nu/kringla/
– http://www.europeana.eu/portal/
– http://www.theeuropeanlibrary.org/tel4/
– http://www.archivesportaleurope.eu/Portal/index.action
• I söktjänsterna samsöks information från flera olika ABM-institutioner
• Metadatat som presenteras i söktjänsterna är aggregerat dvs söktjänsten
visar en begränsad uppsättning metadataelement som är en delmängd av
datat som finns i institutionernas verksamhetssystem.
• Vilka metadatastandard borde användas?
30. Aggregering
• Här är målet att kombinera datakällor.
• Vid sammanföring ingår också
aspekter av immateriella rättigheter -
licensavtal.
32. Interoperabilitet
• strategiskt viktigt, även om svårt att uppnå.
• goda framsteg har gjorts inom vissa områden (t ex den ökade
tillgången av RDF-baserade länkade data samt CIDOC-CRM och
LIDO) men det återstår en hel del arbete
• e-infrastrukturer tillhandahåller tjänster som
kan övervinna tidigare kritiska frågor som skalbarhet och
komplexitet.
• Tekniskt utmanande med betydande insatser och investeringar.
• Oftast inga generella lösningar
• När interoperabilitet har uppnåtts kan det stödja aggregering,
34. • Digitalisering och aggregering
Kulturarvsinstitutioner/myndigheter (nationella
insatser och EU-finansierade projekt)
• Infrastrukturens utveckling
IT och e-infrastrukturleverantörer tillsammans med
användargrupper
• Nya tjänster, nya produkter
Kreativa industrin + kulturinstitutioner
36. • Metadatastandarder är av avgörande
betydelse för att få fram relevanta
sökresultat och tillhandahålla en god
service för användarna.
• Avancerad sökning är en viktig tjänst för
användning av dataresurser.
• Används främst av slutanvändare.
38. Museets samlingar består framför allt av fysiska objekt
Digitala objekt med beskrivande metadata tillgängliggör information om de
fysiska objekten.
• Ofta finns det flera digitala objekt kopplade till samma fysiska objekt, t ex:
– olika fotografier av objektet
– 3D-modeller
– Rekonstruktioner
– AV-material, m m
• Olika metadata för olika målgrupper: forskare, allmänheten, flerspråkig
information.
• Det finns inga formella internationella standarder för beständiga
identifierare för samlingar i
museer.
• I Storbritannien används ofta MDA-koder på delar av samlingar, men det
är sällsynt.
39. Alla dessa objekt, fysiska och digitala, och
kopplingar mellan dem måste hanteras.
Beständiga Identifikatorer (PID – Persistent
identifers) har en viktig roll som en länkande
mekanism mellan fysiska och digitala objekt.
• Föremålsposter som består av flera objekt,
hanteras ofta (men inte alltid) som ett enda
föremålsnummer. Därför är det möjligt att
använda samma standard (URI: er) för att
definiera och hantera PID för sådana poster.
40. • Trasiga länkar och innehåll som flyttats runt på grund av
ombyggnad av webbsidan, etc är ett akut problem som påverkar alla
portaler och söktjänster.
• Forskning och utveckling sker redan i detta område, och ett eller
flera av de befintliga systemen skulle kunna användas med få
anpassningar.
• Ett PID register är en tjänst som med fördel skulle kunna
centraliseras eller molnbaseras, digitala infrastrukturer har mycket
att erbjuda här.
• Kraven varierar inte mycket från ett initiativ till ett annat - detta är en
tjänst användbar för de flesta
42. • Publicering av digitala filer på Internet
innebär inte automatiskt att materialet är
fritt för användning och återanvändning.
• Öppen data är licensierad för fri
användning, i maskinläsbara format, med
öppna standarder, och helst som
länkad/länkbar data.
43. För att se till att information om ett
objekt, relaterad information och
dess digitala kopior kan vara
beständigt relaterade till varandra
vid olika tidpunkter
och från olika platser är det
nödvändigt att
använder ”persistent identifiers"
(PID).
44. Europeanas video om LOD
• http://pro.europeana.eu/linked-open-data
• Cambridge ..filmen LOD
• http://www.cambridgesemantics.com/sv/seman