Dal digitale alla carta: l’informatica al servizio della tutela del libro antico
1. Dal digitale alla carta:
l’informatica al servizio della tutela del libro antico
Alessandro Milani, esperto di informatica applicata al libro antico
Paolo Tentori, docente di informatica applicata al libro antico
Il presente lavoro nasce nell’ambito dei corsi di aggiornamento sulle
tecnologie digitali applicate al libro antico organizzate nel tempo per i bibliotecari
dell’ABEI (Associazione dei Bibliotecari Ecclesiastici Italiani). È oggi possibile,
con investimenti minimi, rendere autonome le biblioteche nel campo della
digitalizzazione del libro antico e dell’organizzazione delle risorse tramite
metadati. Grazie alla stampa digitale progetti fino a pochi anni fa troppo costosi
vengono oggi realizzati con successo, tra questi la creazione di facsimili di grandi
dimensioni in tiratura limitata1
.
1- Gli autori hanno lavorato nel 2017 alla realizzazione della copia a stampa del planisfero di
Urbano Monte, voluminoso manoscritto di 32x44 cm. custodito presso la Biblioteca del Seminario
arcivescovile di Milano composto da ben 370 carte. Le prime digitalizzazioni del manoscritto
risalgono al 1996 e a suo tempo venne realizzato un CD-ROM con l’opera integrale in pdf. Pochi
anni prima l’editore Periplo di Lecco stampò un’ edizione delle 64 tavole del planisfero in formato
ridotto ma di ottima qualità grazie alle foto realizzate in occasione del restauro del manufatto che
portò allo smembramento della legatura con la possibilità di allineare perfettamente in piano le
carte del manoscritto. Le dia 90x120 mm. a suo tempo realizzate, sono state ridigitalizzate con uno
scanner a tamburo per poter fare un confronto immediato con le foto digitali acquisite nel 2017 e le
scansioni del 1996. I bibliotecari sono così in grado di toccare con mano la fedeltà del colore e la
nitidezza dei dettagli con la tecnologia applicata allo stesso libro in vent’anni con sorprese notevoli
che potete ammirare anche negli esempi allegati a questo studio nelle pagine seguenti.
Una tavola dell’Urbano Monte in originale e sullo sfondo il set di luci fredde a led utilizzate per la
digitalizzazione nel 2017.
2. Il tipografo incaricato della stampa del facsimile ispeziona gli inserti di ogni singola carta per
restituire nel modo più fedele le caratteristiche del manufatto nel facsimile.
Digitalizzazione effettuata nel 2017 da scanner a tamburo su diapositiva scattata nel 1984 dal
fotografo Vivi Papi (1937-2005) in occasione dello smembramento del codice prima del restauro.
3. Messa a confronto della tavola originale dell’Urbano Monte e dell’edizione Periplo del 1987.
La tavola originale riproducente il Giappone messa a confronto con la stampa ricavata dalle scan-
sioni del 1996 assemblate in Photomerge di Adobe Photoshop.
4. Un settore ancora più recente della tecnologia si è concentrato negli ultimi anni
sulla colorazione di film e foto in bianco e nero per ottenere risultati il più vicino
possibile al reale. Investimenti di rilievo sono stati attuati all’inizio nell’ambito
del recupero di film storici da parte di multinazionali cinematografiche ma in
seguito sono nate sturt up di piccole dimensioni e gruppi di lavoro in ambito
scientifico interessati ad implementare algoritmi matematici che interpretassero
grandi quantità di dati nell’ambito della colorazione di foto in contesti tra i più
disparati.
La tecnologia ha fatto passi da gigante e il nostro gruppo di lavoro ha voluto
testare l’affidabilità del metodo su un microfilm facilmente a portata degli autori:
il Messale di Civate, cod. 2294, Biblioteca Trivulziana di Milano2
.
Il microfilm ha due grossi vantaggi: è confrontabile con l’originale oggi custodito
in Trivulziana; gli autori non ne hanno mai visto l’opera completa se non che
per le cinque foto messe a disposizione sul sito dell’ICCU. Siamo stati così
‘costretti’ a fare scelte precise basate solo sull’affidabilità del software applicato
e sulle conoscenze codicologiche e paleografiche nei, tra l’altro frequenti, casi di
incertezza per la restituzione di una colorazione plausibile da scala di grigio come
2- Nell’ambito del progetto ‘Grafiche in Comune’ il Messale di Civate sarà a breve a disposizione
digitalizzato a colori ad alta risoluzione sul sito della Biblioteca Trivulziana (nel settembre 2017,
data di stesura del presente lavoro, l’opera non risultava però ancora on line). Il microfilm fu a
suo tempo acquistato in biblioteca da uno dei due autori nell’ambito della sua tesi di paleografia
musicale. Abbiamo chiesto il permesso alla Direzione della Biblioteca di poter effettuare questo
lavoro scientifico che non ha ovviamente lo scopo di restituire un facsimile fedele all’originale
ma di testare l’affidabilità dell’algoritmo. In ogni caso, per la prima volta, è a disposizione degli
studiosi una copia completa del codice sia in pdf che a stampa con ricolorazione plausibile.
Il microfilm in bianco e nero del Messale di Civate è stato completamente digitalizzato nel 2017
tramite scanner a tamburo per ottenerne le basi da ricolorare.
5. spiegheremo in seguito più nel dettaglio.
Colorized microfilm:
studi di riferimento con cui ci siamo confrontati per il nostro lavoro
Due gruppi di lavoro, entrambi americani, hanno creato strumenti di utilizzo
immediato per testare in modo automatico la ricolorazione di fotografie3
. Questi
studiosi hanno messo in rete tools automatici di ricolorazione utilizzabili in modo
immediato e gratuito.
Algorithmia: caratteristiche fondamentali.
Il tool, applicato ad una pagina scritta, divide fondalmente lo spazio in “colore di
sfondo” e “colore di scrittura”. Non individua in automatico, nel nostro caso, la
differenza di colore tra iniziali rubricate in rosso, marrone scuro di testo in carolina
e nero seppia delle glosse in gotica. Fornisce quindi una base pigmentata che
richiede un intervento posteriore di carattere grafico informatico con programmi
tipo Adobe Photoshop. La tecnica è applicabile quindi in modo funzionale e con
ottimi risultati a manoscritti testuali piuttosto uniformi. Sotto un esempio applicato
ad un’immagine di pagina di manoscritto in sanscrito custodito presso l’University
of Virginia (a sinistra l’originale, a destra l’immagine in bianco e nero e l’uscita
3- I siti di riferimento sono:
- algorithmia, testabile al sito http://demos.algorithmia.com/colorize-photos/). Il gruppo di
lavoro di algorithmia comprende Richard Zhang, Phillip Isola, Alexei A. Efros dell’University
of California, Berkeley. L’articolo più facilmente fruibile on line sul metodo da loro applicato è
“Colorful Image Colorization”, al seguente link: https://arxiv.org/pdf/1603.08511.
Il loro scopo è quello di fornire uno strumento totalmente automatico per la produzione di foto a
colori da bianco e nero basandosi su un algoritmo che fa tesoro dell’analisi semantica di milioni di
immagini per minimizzare errori di proposta plausibile di colore;
- colorizephoto, curato da Neil Kronlage, raggiungibile all’indirizzo http://www.colorizephoto.
com/converter.
6. derivata in automatico su algorithmia.com).
Una volta registrati gratuitamente il sito dà la possibilità di analizzare e rielaborare
grosse quantità di dati basandosi su credits gratuiti (iniziali) e l’inserimento di un
piccolo script in python a ‘dimensione di bibliotecario’. Il limite dell’applicazione
sta nel proporre un’uscita colorata ‘rigida’ che anche in presenza di semplici
rubriche colorate (in rosso come nel caso del Messale di Civate) non fornisce spazi
gestibili velocemente sulla semplice profondità di colore. Questo meccanismo è
applicato prefettamente invece in colorizephoto, vantaggio che ci ha fatto optare
per l’uso di questo software per la colorazione del Messale di Civate.
Schermate d’uso online di algorithmia. In centro la proposta sulla pagina più complessa del Mes-
sale di Civate come restituita in automatico dal sito.
7. Colorizephoto: caratteristiche fondamentali.
A differenza di algorithmia, colorizephoto divide la pagina in uno spazio da
colorare ed uno spazio con foto di riferimento.Abbiamo trovato l’idea ottimale per
un manoscritto come il Messale di Civate che, su una base uniforme di pergamena
presenta miniature semplici, testo di base color seppia, glosse in inchiostro nero
e rubriche in rosso. La percezione della profondità di scala di grigio anche se
obbliga a scegliere gli spazi da ‘colorare’ non obbliga l’operatore a scontorni di
testo complicati e molto impegnativi dal punto di vista dell’impiego di tempo.
Il software comunque non individua le rubriche in rosso in automatico e questo
obbliga l’operatore addetto alla colorazione della pagina ad avere conoscenze
paleografiche della mise en page e della mise en texte di un codice medievale. Per
quanto riguarda il Messale di Civate gli operatori hanno lavorato ‘in cieco’ ma
con la fortuna di avere come pagina di riferimento una delle cinque pubblicate
dalla Biblioteca Trivulziana sul sito dell’ICCU. L’immagine è stata usata come
da esempio sottostante per definire gli ambiti di colori successivamente applicati
dapprima per il colore di sfondo ed il testo di base che viene applicato con una
‘pennellata’ grossolana e molto veloce. Il rosso dell’iniziale a destra è stato
applicato nel caso di questa pagina ai titoli del calendario normalmente colorati
nella tradizione manoscritta. Se lo sfondo è abbastanza uniforme non occorre
una ‘pennellata’ precisa per definire lo spazio del rosso, essendo il software che
delimita in automatico lo spazio colore, con un grosso vantaggio in termini di
tempistica di esecuzione del lavoro.
A sinistra, pagina ricolorata da scala di grigi prendendo come riferimento la pagina originale del
codice sul sito dell’ICCU.
8. I vari stadi di elaborazione della pagina da scala di grigi a colori in colorizephoto.
La scelta del colore di sfondo della pagina viene applicata in automatico dopo la proposta al sof-
tware da parte dell’operatore di una gamma sfumata di riferimento. Il risultato è un colore plausi-
bile col tipo di oggetto reale a cui ci si riferisce.
9. A sinistra, restituzione definitiva dopo processamento di pagina in scala di grigi in algorithmia.
A destra, il colore di sfondo come generato in colorizephoto. In quest’ultimo caso è possibile con-
tinuare la ricolorazione on line delle rubriche e della miniatura.
Uno degli autori al lavoro di comparazione tra i risultati dei vari algoritmi e l’unica immagine con
miniatura complessa presente sul sito dell’ICCU.
10. La divisione della pagina per area di importanza colore.
A manoscritti con sfumature di colore complesse (miniature elaborate)
corrispondono uscite molteplici a cui il computer deve rispondere e, al momento,
il problema rimane irrisolto per quanto attiene una restituzione certa del colore
originale. Nel tentativo di avvicinarci il più possibile alla realtà abbiamo trovato
interessante quanto proposto da ricercatori dell’Università di Modena e Reggio
Emilia che hanno messo a punto un sistema di divisione in campi degli spazi testuali
e miniati dei codici. Questo rende l’interpretazione dei dati meno massiccia e più
mirata (lo sfondo pagina è più uniforme di un’iniziale illustrata) concentrando i
problemi di interpretazione alle sole miniature.
L’articolo di Grana - Borghesani - Cucchiara che spiega la metodica è raggiungibile al sito:
https://pdfs.semanticscholar.org/0843/04fb09d5dd20574bf3b40f9dc4ba8921b483.pdf
11. Il nostro algoritmo: limiti e prospettive.
Passare da scala di grigi a colore richiede una mappatura della foto che, con
affidabilità più o meno automatica, ha l’obbiettivo di restituire risultati plausibili.
Il limite più evidente che abbiamo riscontrato è che a gamme di grigi specifiche
possono corrispondere ambiti di colore multipli (è il caso ad esempio del blu e del
marrone per la miniatura d’esempio su un codice della Collegiata di Castiglione
Olona che abbiamo usato come test più complesso rispetto al Messale di Civate
in quanto più ricco nella gamma di colori). Questo comporta un intervento
‘umano’ di discernimento che implica, nel caso di codici antichi, conoscenze di
tipo paleografico e codicologico specifico. Nelle immagini seguenti portiamo
esempi di generazione di scale di grigio da colore originale di diapositiva e
del procedimento inverso dato da attuare in automatico al computer. Risaltano
immediatamente i problemi di scelta multipla a cui è sottoposto il calcolatore e di
conseguenza l’operatore con correzioni manuali.
Si tenga presente anche che lo scopo del lavoro non è quello della restituzione
grafica ottimale per cui sono state mantenute ad esempio le slide sfuocate in
originale, sfondi più scuri di alcune pagine interessati da muffe. Nel tempo sarà
l’algoritmo ad ottimizzare i processi o, quantomeno, è ciò che ci prefiggiamo.
Mappatura da colore a scala di grigi e procedimento inverso con un primo risultato finale di rico-
lorazione poco affidabile.