È nato LeviDigiLab

L’innovativo laboratorio di digitalizzazione del patrimonio librario e archivistico della Fondazione Ugo e Olga Levi con la consulenza tecnologica di Made In Heritage.

La Fondazione Ugo e Olga Levi di Venezia, una delle più importanti istituzioni di ricerca musicologica d’Italia, ha avviato, con la consulenza tecnologica di Made in Heritage, un cantiere per la digitalizzazione del patrimonio librario, archivistico e documentale conservato nella sua Biblioteca.

L’iniziativa è denominata LeviDigiLab e comporta la costituzione, presso la sede della Fondazione Levi a Palazzo Giustinian Lolin, di un laboratorio di digitalizzazione dotato di strumenti all’avanguardia per l’acquisizione digitale dei documenti d’archivio, allo scopo di costituire una banca dati unica nel suo genere.

Un aspetto fondamentale del progetto #LeviDigiLab è l’approccio #MadeInHeritage, che  in questo ambito specifico si caratterizza per essere tecnicamente innovativo, operativamente personalizzato ed economicamente e gestionalmente sostenibile.

L’obiettivo del progetto è di raggiungere un alto livello di qualità, benessere lavorativo, e produttività, per ottenerlo è stato necessario considerare l’intero processo e sviluppare tecnologie e metodologie ad hoc.

Per questo gli scanner sono di differenti tipologie, sviluppati su misura, in grado di integrarsi nel flusso di digitalizzazione e di garantire, qualità, sicurezza e standard.

 

Il V-Scanner

V-Scanner_LDL1, terzo esemplare della specie e primo della sua serie, è il risultato di un assiduo  lavoro di ricerca e perfezionamento, ad opera del team di progettazione di #MadeInHeritage, il quale è costantemente proiettato verso lo sviluppo di strumenti di acquisizione digitale dei materiali storici di biblioteche e archivi. 

Il nome dello scanner deriva dalla forma a V tipica del leggio per libri ed è in grado di digitalizzare le due pagine contemporaneamente, centrando in automatico e assecondando lo spostamento del libro dovuto allo scorrere delle pagine. Il vetro garantisce  la stabilità e la planarità della scansione. In questo modo l’operatore può agire agevolmente nel girare le pagine, verificare la corretta inquadratura in anteprima sullo schermo, verificare i parametri di scansione e nel caso fornire i metadati descrittivi quali dimensioni, numero pagine, tipologia di rilegatura, doppia pagina. 

La configurazione del V-Scanner-LDL1 prevede una coppia di fotocamere EOS RP a 26,2 Megapixel; questa soluzione tecnologica, customizzata sulle esigenze specifiche di risoluzione richiesta dal progetto, monta obiettivi Sigma 50mm / F1 4 ART ed è munito di un faro LED 6500 lux / 5400 kelvin con telecomando.

V-Scanner_LDL1 è, specifico per la digitalizzazione di volumi rilegati quali libri fascicoli, opuscoli, e può produrre fino a 500 immagini all’ora. Il piano di ripresa è flottante ed è inserito all’interno di un apposito box oscurato alle fonti luminose esterne. La specificità di questo scanner è la spalla maggiorata per ospitare dorsi rilegati di libri di grande formato, fino a 7 cm di larghezza e i piatti fino a 45 cm di altezza e 35 cm di larghezza.

 

Stativo documenti e pellicola

Il sistema di ripresa denominato Stativo è uno degli strumenti più flessibili che compongono il laboratorio, è in grado di riprodurre in alta risoluzione documenti piani di dimensioni variabili fino ad un massimo di 40 X 50 cm e grazie ad una serie di accessori del piano di ripresa i negativi, i dorsi dei libri, i libri antichi e di pregio.

Il sistema di digitalizzazione è costituito da un set di ripresa fotografico con uno schema a più obiettivi e luci, completamente regolabile nelle tre dimensioni. Lo Stativo si compone di un piano graduato dotato di una colonna con testa fotografica e meccanismo di regolazione  dell 'altezza. La fotocamera e l’obiettivo sono scelte in base alla dimensione e alla tipologia di materiale. Le operazioni di acquisizione sono gestite mediante un software ad hoc che permette di utilizzare la  fotocamera  da remoto. L’impostazione dei parametri di scatto, la messa a fuoco e la ripresa vengono controllate e impostate direttamente dal computer collegato. Nel caso del LeviDigiLab un MacMini Apple.

Vi sono inoltre una serie di accessori che permettono di trattare tipologie di materiali che presentano delle peculiarità, quali ad esempio i negativi fotografici di varie dimensioni che grazie alla tavola retroilluminata possono essere digitalizzati; oppure la culla a 90 gradi per la riproduzione dei libri antichi le cui prescrizioni di conservazione richiedono di non aprire il libro oltre una certa angolazione e di non apporre vetri o particolare pressioni sulle pagine.

 

Il Piano Aspirato

Uno degli strumenti più interessanti del nuovo LeviDigiLab è il cosiddetto Piano Aspirato, nella sua essenza una geniale miscela di tecnologie innovative e abilità artigianale. Il Piano Aspirato è un sistema per la digitalizzazione per documentazione di grande formato come disegni e poster, che per dimensioni, tipologia di materiale e stato di conservazione presentano problematiche complesse di planarità risultando difficili da acquisire.

Il sistema di digitalizzazione è costituito da un set di ripresa fotografico con uno schema a più obiettivi e luci, completamente regolabile nelle tre dimensioni. Il cuore del sistema è un piano di lavoro a depressione d’aria della dimensione di 200 X 100 cm. Tale  piano si compone di un compartimento stagno a cui è collegato un aspiratore regolabile; al lato superiore del piano di appoggio è posto un pannello microforato al fine di permettere l’aspirazione dei documenti.

L’altezza della fotocamera e l’obiettivo sono scelti in base alla dimensione e alla tipologia di materiale. Le operazioni di acquisizione sono gestite mediante un software ad hoc che permette di utilizzare la  fotocamera  da remoto. Anche in questo caso l’impostazione dei parametri di scatto, la messa a fuoco e la ripresa vengono controllate e impostate direttamente dal computer collegato..

Le scansioni vengono effettuate con fotocamere da 50mp Canon Eos R5 con obiettivo Sigma Art 35mm F1.4 DG installate su colonna che permette il posizionamento verticale fino ad un massimo in altezza di 220 cm (limite della sala) dal piano di ripresa.

Per l’operatore far funzionare il piano aspirato è facile: basta appoggiare il documento sulla superficie del piano e, una volta definita l’inquadratura, si procede azionando l’aspiratore e regolando la messa a fuoco, dopodiché si scatta la fotografia. Il piano aspirato LeviDigiLab può scansionare fino a 300 documenti di grande formato al giorno. 

 

Algoritmi

La digitalizzazione dell'archivio storico deve anche essere intesa come un processo di trasformazione della natura fisica dei dati. Per effetto di questa azione ‘preliminare’, i dati registrati su supporto cartaceo (lettera, spartito, scheda, foto) vengono fatti migrare su dispositivo digitale. Si tratta di un'operazione complessa che richiede l'utilizzo di vari strumenti hardware (come ad esempio gli scanner) e software.

Tipicamente, la  digitalizzazione di massa produce quelli che possono essere definiti  big data, i quali devono essere trattati secondo modalità, standard e obiettivi previsti nel progetto. Questa attività si chiama #dataprocessing ed è fondata sull'utilizzo intensivo di algoritmi, una parte consistente dei quali basata su tecnologie di intelligenza artificiale quali computer vision, machine learning e neural network

Nel campo della digitalizzazione dei beni archivistici e documentali, gli algoritmi sono assimilabili a software realizzati tramite apposita programmazione (coding), che svolgono autonomamente una serie di operazioni (conversione, misurazione, trasformazione) sui file con l'obiettivo di:

  • Velocizzare il tempo di elaborazione;
  • Ridurre il numero di persone addette a tale elaborazione;
  • Migliorare il risultato finale.

Per il progetto #LeviDigiLab gli informatici di @mind@ware, partner del network #madeinheritage, hanno sviluppato specifici algoritmi per il trattamento delle immagini che consentono di procedere in modo automatico alla rotazione, ritaglio, correzione colore e  aggregazione delle immagini.

Un aspetto particolarmente importante del progetto è quello finalizzato a sviluppare applicazioni più complesse per il trattamento dei dati d’archivio, sfruttando tecnologie quali la Optical Character Recognition (OCR), la Object Detection (individuazione del contenuto) e la Object recognition  (riconoscimento del contenuto) allenate via machine learning.

Queste soluzioni informatiche agevolano il lavoro degli archivisti in termini di classificazione, raggruppamento, misurazione e infine pubblicazione (ad esempio su Digital Library) delle informazioni e contribuiscono all’affermarsi degli strumenti delle digital humanities per la  valorizzazione e diffusione della memoria custodita nelle biblioteche e negli archivi storici.

 

Conservazione digital

Quando si intraprende una vasta campagna di digitalizzazione dei documenti d’archivio la principale questione da risolvere, insieme con la definizione di modelli di acquisizione dei dati, riguarda le modalità della loro conservazione. L’ambiente digitale è, paradossalmente, molto più sensibile di quello cartaceo al trascorrere del tempo, pertanto la conservazione risulta essere più difficoltosa. Difficoltà che non si devono solo alla natura dell’oggetto digitale ma anche al suo contesto di riferimento, cioè al sistema di relazioni nel quale l’oggetto è inserito.

Gli oggetti digitali sono caratterizzati da un’estrema instabilità, causata principalmente dall’obsolescenza dei supporti di memorizzazione dei formati elettronici e delle loro componenti hardware e software. Al fine di contrastare tale fenomeno, la Library of Congress e i National Archives of UK hanno costituito e diffuso registri che forniscono indicazioni sui formati da utilizzare per la conservazione delle informazioni digitali. E’ utile ricordare che non si conserva materiale digitale ma solamente la capacità di riprodurlo: garantire l’accessibilità nel tempo implica la necessità di dotare l’oggetto digitale della capacità (tipicamente umana) di migrare da uno stato virtuale all’altro per contrastare i rischi legati all’invecchiamento tecnologico e, in ultima analisi, sopravvivere.

Il modello scelto da Made in Heritage per la conservazione dei dati prodotti dalle campagne di digitalizzazione del LeviDigiLab è denominato OAIS (Open Archival Information System ‐ ISO 1472). Esso riveste una particolare rilevanza nell’ambito della digital preservation perché si pone come base concettuale per fornire un quadro di riferimento sulla conservazione, individuando i concetti, le azioni e le funzioni fondamentali da intraprendere. Oggi OAIS rappresenta lo standard di riferimento per la conservazione di oggetti digitali e gestisce l’organizzazione dei dati all’interno di un sistema archivistico digitale, con la finalità di conservare gli oggetti stessi e renderli comprensibili in maniera autonoma.

In estrema sintesi, OAIS costituisce una struttura organizzata di dati in grado conservare informazioni digitali e renderle fruibili in rete, attraverso formati standard e set di metadati disponibili in XML. Metaforicamente, esso è un luogo (biblioteca) virtuale, ricco di oggetti (libri) digitali, che sono dotati della capacità di resistere al passare del tempo. Insieme questi elementi costituiscono un granaio digitale che conserva la conoscenza e permette di superare le carestie dell'obsolescenza, garantendo, senza soluzione di continuità, la trasmissione del sapere di generazione in generazione.

 

La gestione dei processi, MIHA BOX

La costruzione di un laboratorio di digitalizzazione degli archivi è di conseguenza, come appare evidente, un’impresa sia di progettazione sia di messa a punto. La realtà che ne consegue è quella di un organismo a suo modo vivente, che controlla, coordina, corregge le azioni e gli esiti di scanner, computer, software, algoritmi e operatori. La macchina al centro di questo processo articolato e delicato, allo stesso tempo cuore e cervello dei progetti di digitalizzazione degli archivi è il frutto di un’evoluzione tecnologica ed esperienziale e si chiama MIHA BOX.

MIHA BOX è  il fulcro  tecnologico di LeviDigiLab ed è il frutto della trasformazione in senso evolutivo di Time Machine Box, una tecnologia originale sviluppata  da mind@ware, partner fondatore della rete Made In Heritage e certificata da The Time Machine Organisation (TMO), la principale organizzazione internazionale per la cooperazione in tecnologia, scienza e patrimonio culturale nata nell’ambito del progetto europeo Time Machine (https://www.timemachine.eu/).

MIHA BOX permette la gestione dei processi e dei metadati, la conservazione e lo sviluppo degli asset documentali, la condivisione delle immagini, lo storage e il backup dei dati digitalizzati. In sintesi, MIHA BOX rappresenta una straordinaria opportunità per istituzioni e imprese di dotarsi di un sistema di tecnologie integrate e ready to use che semplifica, rendendo più friendly l’utilizzo di strumenti complessi come algoritmi, scanner, digital library, workflow management e OPAC,  i tradizionali processi di digitalizzazione degli archivi storici, che diversamente sarebbero più complicati e onerosi da gestire.

 

Nel suo complesso, il laboratorio di digitalizzazione allestito dalla Fondazione Ugo e Olga Levi con la consulenza tecnologica di Made In Heritage mira alla creazione di una banca dati unica nel suo genere, mediante l'uso di strumenti all'avanguardia per l'acquisizione digitale dei documenti d'archivio. Così facendo, la digitalizzazione di massa viene supportata da algoritmi basati sull'intelligenza artificiale, che automatizzano numerose operazioni di elaborazione delle immagini. Il modello di conservazione adottato è basato su standard che assicurano la conservazione e la fruibilità a lungo termine dei dati digitalizzati. 

Per tutte queste ragioni, LeviDigiLab rappresenta un importante punto di svolta nella valorizzazione e diffusione della memoria custodita nelle biblioteche e negli archivi storici.

 

Andrea Barbon

Le altre storie

Una preziosa raccolta di ritratti ottocenteschi, recentemente confluiti nel nuovo fondo fotografico istituito all’interno del fondo d’archivio di famiglia, adesso digitalizzati e messi a disposizione degli studiosi.
Un patrimonio prezioso per lo studio di molti aspetti della musica a stampa nel Fondo Levi.
I quasi settemila articoli conservati nella serie Rassegna stampa del fondo Guido Piamonte, datati tra gli anni Trenta e Ottanta del Novecento, restituiscono un quadro articolato del giornalismo piamontiano, che appare nel complesso fervido e ricco di sfaccettature.