ITA - Il lavoro presenta il concetto di metadato, l'evoluzione degli standard catalografici e le ragioni della normalizzazione di regole e formati che traggono le loro origini nella cooperative cataloguing, avviata da Melvil Dewey nel corso della prima conferenza dei bibliotecari statunitensi tenutasi a Philadelphia nel 1876, il quale portò con forza all'attenzione dell'assemblea l'importanza di predisporre e stampare delle schede catalografiche da mettere a disposizione delle biblioteche americane, al fine di evitare che i bibliotecari dovessero rifare la stessa cosa migliaia di volte quando catalogano gli stessi libri acquistati dalle biblioteche del loro Paese. Il sentire dell'assemblea di Philadelphia può essere ben riassunto dalle parole pronunciate in quell'occasione dal prof. Otis Hall Robinson, bibliotecario della Rochester University «nothing can be more annoying than to do work which one knows is done by others over and over in all our libraries, and which might be done once for all». Dewey nel lanciare l'iniziativa di condividere la catalogazione per evitare che un libro venisse catalogato n volte nelle biblioteche degli Stati Uniti, riprende l'idea di Charles C. Jewett, mai realizzata per l'inadeguatezza della tecnologia allora disponibile, che nel 1851 concepisce il progetto "A plan for stereotyping catalogues by separate titles and for forming a general stereotyped catalogue of public libraries in the United States", immaginando una circolazione delle notizie bibliografiche tramite la realizzazione di cataloghi, in forma di volume a stampa, rapida e a basso costo. Successivamente, anticipando il Cataloguing in Publication project si arriverà all'inserimento delle schede catalografiche stampate su carta sottile all'interno dei libri pubblicati, in modo tale che potessero essere ritagliate e incollate sulle schede di cartoncino del catalogo. Risultò subito evidente che la circolazione delle schede, indipendentemente dalla modalità di distribuzione, richiedeva una condivisione di regole catalografiche che allora ancora non era consolidata, in tal senso prima lo stesso Melvil Dewey, e poi l'ALA, prendendo come riferimento le regole elaborate da Panizzi nel 1841, da Jewett nel 1852 e da Cutter nel 1876, iniziano a definire e diffondere delle regole comuni per tutte le biblioteche americane.
Questo principio di condivisione di schede e regole, necessario per ridurre tempi e costi della catalogazione, che mutuando le parole di Ranganathan, potrebbe essere sintetizzato in una non dichiarata sesta legge della bibliotecomia "Save the time of the librarian", ha guidato l'attività di normalizzazione catalografica in ambito internazionale, portando, all'evoluzione dei formati di scambio, a partire dal MARC, al programma dell'IFLA per l'Universal Bibliographic Control, allo standard ISBD, fino a FRBR. Questa evoluzione della catalogazione ha condizionato formati e standard penalizzando la descrizione di documenti unici come i manoscritti ...
Normalizzare per condividere. Esigenze di ricerca, reperimento e catalogazione flessibile
1. Normalizzare per condividere.
Esigenze di ricerca, reperimento e catalogazione flessibile
Fabio Venuda
Milano
Archivio Storico Civico
e Biblioteca Trivulziana
26 novembre 2015
2. Dati, informazioni, conoscenza
• dato
– un singolo elemento informativo: il nome di un file, la data di
edizione, il titolo di un libro ...
• informazione
– un insieme di dati collocato in un contesto di riferimento: la
voce di un’enciplodedia, una notizia bibliografica (insieme di
dati)
• conoscenza
– il saper usare e produrre informazioni: saperle selezionare e
valutare, il saperle gestire e utilizzare per produrre nuove
informazioni, ad esempio per un lavoro di ricerca, per scrivere
un libro o una tesi
3. I Metadati
• Termine e uso sembrano non
chiari e destinati ai tecnici
• In realtà sono molto comuni
e vengono usati ogni giorno
• Anche ora
- Le informazioni sulla giornata di
studi... non sono la giornata
• Differenti tipi di metadati
- Descrittivi ... il vostro nome
– Che consentono di navigare nello
spazio fisico ...
– Prendere delle decisioni ...
• se venire o no alla giornata di studi
• se girare a sinistra per prendere il
Traghetto o entrare nel parcheggio
4. I Metadati
• Nel mondo fisico
per oggetti fisici
• Ma
particolarmente
importanti per le
risorse digitali e
online ... che
usiamo ogni
giorno
– Foto digitali
5. Cosa sono ...
• Dati che descrivono altri dati
• Informazioni strutturate o meno che
– Descrivono
– Spiegano
– Localizzano
– Permettono di reperire, identificare, usare o gestire una risorsa
fisica o informativa, analogica o digitale (NISO, 2004)
• Metadati differenti, per usi differenti, per differenti
comunità
– ICOM – Geografici – Biblioteche digitali -
• Oggi vengono riferiti a dati e informazioni leggibili dai
computer, oppure per registrazioni che descrivono ERs
6. Metadati per descrivere, organizzare, gestire
• Descrittivi
– descrivono una risorsa allo scopo di trovarla e identificarla,
selezionarla,ottenerla, navigarla ...
• descrizione e accessi, abstract
• Strutturali
– indicano come oggetti compositi vadano organizzati e rimessi
insieme
• le pagine di un libro in una biblioteca digitale
• Gestionali - Amministrativi
– danno informazioni su come gestire una risorsa
– quando e come è stata creata, tipo di file,
– hanno diversi sottoinsiemi
– I due più comuni
• Gestione dei diritti (Rights management metadata)
• Conservazione (Preservation Metadata)
7. Motori di ricerca e metadati
• Motori di ricerca
– Trovano le informazioni indicizzando più o
meno automaticamente i documenti presenti in
rete
– Catturando e analizzando le pagine Web
presenti in Rete (Harvesting) con degli spider
– Estraendo e indicizzando le parole signifcative
presenti nel documento
– Oppure interpretando le parole già inserite nel
documento (MetaTag) che ne descrivono il
contenuto
– Più precise sono le parole inserite, maggiore è
la precisione delle informazioni recuperate
8. Motori di ricerca e metadati
• MetaTag
– Informazioni sul documento e
sulle sue cratteristiche per poterlo
• Trovare, Identificare e Ottenere
(come una scheda di catalogo)
• HTML
– Prevede degli elementi descrittivi
nell’intestazione <HEAD> della
pagina web
<head>
<meta name="description" content="Free Web tutorials">
<meta name="keywords" content="HTML,CSS,JavaScript">
<meta name="author" content="Hege Refsnes">
</head>
<body>
9. Dublin Core
• 1995 a Dublin (Ohio) Workshop tra NCSA e OCLC
• 15 semplici elementi per consentire all’autore o
all’editore di un oggetto digitale di
– Fornire una descrizione corretta e completa dell’oggetto
– Integrata nell’oggetto stesso
– Senza conoscere regole di catalogazione
Creatore
Creatore sec.
Editore
Diritti
Data
Formato
Lingua
Identificatore
Contenuto Responsabiltà Manifestazione
Titolo
Soggetto
Descrizione
Copertura
Fonte
Relazione
Tipo di risorsa
10. In realtà
• I metadati sono utilizzati da sempre
– lista dei rotoli manoscritti conservati nelle capsae
– le informazioni registrate nei tituli
– bibliografie
• Considerati dati su altri dati
– dati che informano su altri dati
– dati che descrivono altri dati
– che consentono di trovare
usare gestire altri dati o risorse ...
11. Metadati descrittivi nell’ambito bibliotecario
• Indicano qualsiasi schema per la descrizione delle risorse
• Sono applicati a qualsiasi tipo di oggetto digitale o non
digitale
• La catalogazione è una forma di Metadati
• Le informazioni che tradizionalmente i bibliotecari
utilizzano nei cataloghi
Metadati nell’ambito bibliotecario
14. 1876 – Melvil Dewey e A.L.A.
1851-1931
Amherst College
«nothing can be more annoying than to
do work which one knows is done by
others over and over in all our libraries,
and which might be done once for all»
Otis Hall Robinson (1835-1912), Rochester
University Librarian
15. La prima conferenza e la Cooperative cataloguing
• Come riprodurre le schede
• Come farle arrivare alle biblioteche americane
• Quale istituzione avrebbe dovuto farsene carico
Come riprodurre ...
• Eliotipia alla Boston Public Library
• Inchiostro tannico
• Stampa di 70.000 schede anno
(1831-1897)
Boston PL –
Harvard libraries –
1. ALA president
16. La prima conferenza e la Cooperative cataloguing
• Come far arrivare le schede alle biblioteche – PW 1878
17. Il bisogno di normalizzare: il Co-operative
Committee e il Library Bureau
• 8 report tra 1877-78
• Normalizzazione
delle schede,
cataloghi, etichette
e scaffali
18. Normalizzare:
le regole
• Panizzi 1841
• Jewett 1952
• Cutter 1876
• Dewey 1877
«is to know how the title
are to be prepared»
catalogazione centralizzata
• A.L.A. 1878
• A.L.A. 1941-
1949
• LoC 1901 servizio
distribuzione schede
19. E i formati? Hermann Hollerith (1860 –1929)
• Columbia Univ.
• US census 1880
• Quesiti
156 (1870) 13.010 (1880)
• US census 1890
– ...
• 1889 tabulating machine
20. Scheda perforata di Hollerith a 288 posizioni:
12 verticali per 24 orizzontali
29. I formati di scambio dei dati bibliografici
• Dal 1876 USA record-sharing environment
• Spinta per la normalizzazione dei formati
• Focus Automazione LoC potenziare la
circolazione delle schede
• Library of Congress – 1964 Henriette Avram
MARC project MARC II 1967-68 ...
• IFLA – 1973 – ISBD (M)
• IFLA – 1974 - Universal Bibliographic Control
• IFLA – 1977 - UNIMARC
30. E i manoscritti?
Descrizione
Ricerca Scientifica in
ambito storico, bibliografico,
filologico, storico-artistico,
paleografico, archeologico –
necessariamente fluida – di
un oggetto unico
31. FRBR – Functional Requirements for
Bibliographic Records – Entity Relationship - 1998
• Circolazione dei dati catalografici
– Ridurre i costi della catalogazione
– Uniformità e coerenza nelle scelte catalografiche
• FRBR
– Semplificare la catalogazione
– Livello minimo di elementi per record bibliografico
– Punto di vista di chi utilizza i record
– Ampliare la condivisione all’esterno delle biblioteche
32. FRBR ER
• Modello Entity Relationship
• Fornisce una visione statica delle collezioni
– Come prodotti nello stato in cui si trovano al momento della
descrizione
• Non considera esplicitamente i processi produttivi
• Non considera eventi subiti da quando sono stati creati
• Materiale librario, un conglomerato di 4 strati distinti:
– Opera Espressione ed Esemplari che appartengono alla
stessa Edizione (Manifestazione)
(Patrick Le Boeuf BNF)
33. CIDOC-CRM – 1996
Comitato Internazionale per la Documentazione – Conceptual
Reference Model
• Realizzato per la rappresentazione di oggetti
museali
• Visione dinamica degli oggetti
– Considera gli eventi subiti da quando sono creati a
quando vengono distrutti
• Al centro del modello la nozione di fenomeno
temporale (Temporal entities)
– Contestualizzazione storica
– Da dove proviene
– Quando è stato creato
– Quali modificazioni ha subito e quando
– Cosa ha determinato le sue caratteristiche attuali
– 80 classi e più di 130 proprietà
34. FRBRoo - object oriented
• IFLA e ICOM-CIDOC - 2003 – International Working Group
on FRBR/CIDOC-CRM Harmonisation
• Mantiene la distinzione fra Opera ed Espressione, e fra
Manifestazione e Item
– Espressa però nello stesso formalismo del CIDOC-CRM
• Mantiene le nozioni Temporali e di Evento di CIDOC-CRM
• Più adatto per la descrizione di documenti unici e rari
conservati nelle biblioteche
– Rende possibile registrare la storia dei documenti
– Chiarisce la questione Manifestazione e Item per documenti unici
35. FRBRoo – object oriented
• Dichiara due strutture distinte
– Documenti unici
– Documenti prodotti in n esemplari
• Manoscritto come un’istanza di una
Manifestation singleton
– Item non menzionato in questa classe
• Per le opere in n esemplari
– Struttura simile a FRBRer W E M I
le informazioni sulla giornata di studi, metadati che descrivono la giornata
Motori di ricerca
Trovano le informazioni indicizzando più o meno automaticamente i documenti presenti in rete
Catturando e analizzando le pagine Web presenti in Rete (Harvesting) con degli spider
Estraendo e indicizzando le parole signifcative presenti nel documento
Oppure interpretando le parole già inserite nel documento (MetaTag) che ne descrivono il contenuto
Più precise sono le parole inserite, maggiore è la precisione delle informazioni recuperate
La codifica dei documenti digitali prevede appositi campi detti metatag all'interno del documento, con la funzione di consentire ai motori di ricerca di ottimizzare il recupero dell'informazione,
Il Dublin Core (DC) nasce nel Marzo del 1995 da un workshop organizzato congiuntamente dal National Center for Supercomputing Applications (NCSA) e dall’Online Computer Library Center (OCLC) a Dublin, in Ohio (USA),
per discutere riguardo le difficoltà nel trovare le risorse desiderate attraverso il Web con l’obiettivo di sviluppare un insieme di metadati per descrivere le informazioni in rete facilitandone di conseguenza la ricerca e il recupero.
Unimarc, come il Marc21 sono anche dei formati di scambio dei dati bibliografici
Tutti questi schemi di metadati e formati di scambio rispondono ad un unico bisogno di normalizzazione
Vediamo come si è evoluto nel tempo e quali sono state le ragioni che hanno condotto a questi schemi e standard sviluppati in ambito bibliografico
Venticinque anni dopo il «Plan for stereotyping catalogues» di Jewett, nel corso della prima Conference of Librarians che ebbe luogo a Philadelphia dal 4 al 5 Ottobre 1876, Melvil Dewey, che fu fra i fondatori dell'American Library Journal e dell'American Library Association (ALA) costituita proprio al termine della conferenza, portò con forza all'attenzione dell'assemblea l'importanza di predisporre e stampare delle schede catalografiche da mettere a disposizione delle biblioteche americane.
Dewey ricorda che da più parti e in molti articoli viene ripetutamente segnalata la mancanza di buon senso dell'attuale modo di lavorare che porta i bibliotecari a rifare la stessa cosa migliaia e migliaia di volte quando catalogano gli stessi libri acquistati dalle molte biblioteche del loro Paese.
Robinson “nothing can be more annoying than to do work which one knows is done by others over and over in all our libraries, and which might be done once for all”
i numerosi interventi dei delegati si snodano lungo due direttrici, considerando i diversi metodi utilizzati nelle loro biblioteche per duplicare le schede e immaginando quali fossero le possibilità di far arrivare le schede pubblicate alle biblioteche americane, più un terzo aspetto, non secondario relativo a quale organismo o istituzione avrebbe dovuto farsene carico
Publishers’ Weekly, v.14 - 1878
In un'ottica di cooperazione, l'esigenza di normalizzare, oltre agli aspetti materiali e organizzativi, non potè non coinvolgere anche le regole di catalogazione
Esigenza già emersa nel piano di Jewett per la creazione di un catalogo a stampa basato sulla stereotipia.
Dewey e Robinson nel corso della conferenza di Ottobre a Filadelfia immaginano un servizio di catalogazione centralizzata condotta da una istituzione autorevole, che possa contare sulla cooperazione delle maggiori biblioteche del Paese.
Dewey nel 1877 su LJ propone un primo report sulle modalità di preparazione delle schede, un set regole di catalogazione sottoposto all'attenzione dell'Associazione da un gruppo di autorevoli bibliotecari affinché diventasse uno standard per la cooperazione catalografica
1901 – Library of Congress avvia il servizio di produzione e distribuzione delle schede alle biblioteche
immigrazione dall’Europa - crescita popolazione - aumento delle informazioni richieste dal governo
7 soggetti di indagine 1840
Popolazione, agricoltura, manifatture, miniere, pesca, commercio, educazione
23 soggetti del 1880
156 domande del 1870 13.010 del 1880
1882-1889 inventa un sistema di codifica delle informazioni
Schede perforate 1 persona – 1 scheda
Enumerators, fori per le variabili: distretto, razza, sesso, stato civile
Lettura, interpretazione conteggio, con attrezzature elettromeccaniche
Prima applicazione larga scala
x l’11. censimento 1890
Gestione manuale del lettore di schede
Elaborazione di 40 schede al minuto
Conteggio, ma non somma dei valori
x il 12. censimento 1900 e dopo
Nuove funzioni:
Alimentatore automatico e spazzola rotante
Somma dei dati e nuovo pannello di controllo, migliore programmazione, per applicazioni diverse
quadrante:
100 posizioni due lancette = unità e centinaia = un giro completo della lancetta delle unità faceva avanzare di una posizione la lancetta delle centinaia, e contare fino a 10.000
Check List dilibri e opuscoli nelle scienze sociali nella NYState Library - 1956
Ferranti - University of Toronto -
comprimere nelle 800 posizioni perforabili della scheda gli elementi della notizia bibliografica
UBC – programma permanente finalizzato a rendere universalmente disponibili, su diversi supporti e in forma standardizzata, definita e accettata in ambito internazionale, le registrazioni bibliografiche delle pubblicazioni prodotte in tutti i paesi, contando sulle Agenzie bibliografiche Nazionali, responsabili della documentazione completa e autorevole della produzione editoriale di ciascun paese.
Scopo è che ogni pubblicazione venga catalogata una sola volta dalla Agenzia Bibliografica della nazione in cui è pubblicato e che la riceve per diritto di stampa, e la registrazione bibliografica venga resa disponibile secondo standard e formati internazionalmente riconosciuti.
Oltre alla funzione di localizzazione e raggruppamento (delle copie manoscritte di un’opera o delle opere di autore) la rappresentazione catalografica di un manoscritto ha la funzione di fornire informazioni sulla storia dell’oggetto, dell’opera in esso contenuta, delle mutazioni subite nel corso del tempo ...
La descrizione di un manoscritto può essere paragonata ad un saggio scientifico, un articolo sul manoscritto e sulla opera o sulle opere in esso rappresentate.
Che si adatta con difficoltà ai contenitori, schemi di metadati e formati di scambio, elaborati per favoreire la Cooperative Cataloguing, per far sì che, prima lo stessa pubblicazione venga catalogata allo stesso modo da tutti i bibliotecari del mondo, per poi poter catalogare ogni pubblicazione una volta sola e tutte le biblioteche che possiedono una copia uguale possano derivare il record bibliografico.
Tanto è vero che la prima operazione che viene chiesto di fare in un sistema è verificare se esiste già una catalogazione, autorevole, per la pubblicazione che si sta catalogando.
In tal senso so sono sviluppati anche i modelli concettuali che hanno modificato la catalogazione moderna, mettendo ordine e adeguando la funzionalità dei record bibliografici alle esigenze attuali e alle potenzialità offerte dai database che gesticono i cataloghi elettronici.
La caratteristica più eclatante del modello è la sua analisi del materiale librario come un conglomerato di 4 strati distinti
Distingue fra
Entità Temporali che riguardano lo stato e i cambiamenti di stato
e Persistent Items nozione che copre sia gli oggetti fisici (un quadro) sia cose concettuali (l’immagine visibile sulla tela riconoscibile in ciascuna delle copie esistenti)