Paolo Monella - Fabio Cusimano Linking Text and image: TEI XML and IIIF

1. Details
1. Dettagli
On Wednesday July 3, 2019 Paolo Monella and Fabio Cusimano led a workshop entitled Linking Text and image: TEI XML and IIIF in the framework of the Summer School ReIResources: Sharing Resources in a Networked Digital Ecosystem (Bologna, Italy July 3-5) organized by ReIReS (Research Infrastructure on Religious Studies) and Fscire (Fondazione per le scienze religiose) Giovanni XXIII in partnership with AIUCD (Associazione per l'Informatica Umanistica e la Cultura Digitale) and Veneranda Biblioteca Ambrosiana.
Paolo Monella led part 1 of the workshop (on TEI XML); F. Cusimano led part 2 (on IIIF).
Mercoledì 3 luglio 2019 Paolo Monella e Fabio Cusimano hanno condotto un workshop intitolato Linking Text and image: TEI XML and IIIF nel contesto della summer school ReIResources: Sharing Resources in a Networked Digital Ecosystem (Bologna, 3-5 luglio) organizzata da ReIReS (Research Infrastructure on Religious Studies) e Fscire (Fondazione per le scienze religiose) Giovanni XXIII in partnership con AIUCD (Associazione per l'Informatica Umanistica e la Cultura Digitale) e Veneranda Biblioteca Ambrosiana.
Paolo Monella ha guidato la parte 1 del workshop (su TEI XML); F. Cusimano, la parte 2 (su IIIF).
2. Abstract
Part 1 (TEI XML)
Parte 1 (TEI XML)
In the first part of the workshop, led by Paolo Monella and centered on digital textual modelling and TEI XML, students will create a digital (formal, machine-actionable) model of a portion of a text from a medieval manuscript, both gaining hands-on experience and reflecting on the methodological and theoretical foundations and issues of textual modelling.
They will follow a inductive path, moving from the elementary structures of the computer (a sequence of binary states, "on/off", "yes/no", often represented by "0" and "1") to binary and decimal numbers and charsets (ASCII and Unicode).
At this point, the hands-on experience will start: students will create their own textual markup language based on symbols of their choice and will be asked to reflect on the theoretical and methodological issues arising from inline markup.
They will then be introduced to the SGML/XML syntax and to the TEI XML vocabulary and will encode a brief textual portion taken from a medieval manuscript, based on its digital images and using the TEI module for the transcription of primary sources.

The students will then be presented, and will practice, two alternative strategies for combining TEI XML, the current standard for scholarly text encoding, with IIIF, the rising standard for online image metadata and annotation:
- the first approach consists in linking to the digital images of the manuscript from within the
TEI XML source, for example with the TEI attribute
@facs
; - with the second approach, the whole TEI XML transcription is included in the IIIF metadata as an "Annotation".
This will constitute a bridge with the second part of the workshop, led by Fabio Cusimano, focussed on IIIF.
Nella prima parte del workshop, condotta da Paolo Monella e centrata sulla modellizzazione digitale del testo e su TEI XML, gli studenti creeranno un modello (formale, machine-actionable) di una porzione di testo tratto da un manoscritto medievale, da un lato ottenendo esperienza diretta e dall'altro riflettendo sulle basi teorico-metodologiche e sulle questioni aperte della modellizzazione del testo.
I corsisti saranno accompagnati in un percorso induttivo e laboratoriale che partirà dalle strutture elementari del funzionamento del computer (una sequenza di stati binari, "aceso/spento", "sì/no", spesso rappresentati con "0" ed "1"), fino ai numeri binari, a quelli decimali, ai CharSet (tabelle di caratteri come ASCII o Unicode).
A questo punto, inizierà l'esperienza diretta: gli studenti creeranno un loro linguaggio di markup basato su simboli scelti da loro, e saranno portati a riflettere sulle questioni teoriche e metodologiche legate all'inline markup.
Saranno dunque introdotte la sintassi SGML/XML e il vocabolario TEI XML. Gli studenti codificheranno una breve porzione testuale tratta da un manoscritto medievale, partendo dalle sue riproduzioni digitali e usando il modulo TEI per la trascrizione delle fonti testuali.

Infine, si presenteranno agli studenti due strategie alternative di integrazione tra TEI XML (lo standard attuale per la codifica testuale nel mondo della ricerca umanistica) e IIIF (lo standard emergente per la metadatazione e l'annotazione di immagini nel Web):
- il primo approccio consiste nel creare nel codice TEI XML (ad esempio tramite l'attributo
TEI
@facs
) link che puntino alle immagini digitali del manoscritto; - col secondo approccio, l'intera trascrizione TEI XML è incusa all'interno dei metadati IIIF come "Annotation".
Gli studenti praticheranno entrambe le strategie. Ciò costituirà un ponte verso la seconda parte del workshop, condotta da Fabio Cusimano e centrata su IIIF.
Part 2 (IIIF)
Parte 2 (IIIF)

The second part of the workshop will be focused on digitization good practices, digital library design and IIIF (International Image Interoperability Framework).
Fabio Cusimano will introduce these topics as tiles of a complex mosaic, starting from a real-life case study: the on-going digitization experience at the Veneranda Biblioteca Ambrosiana in Milan.
Then, the students will be presented the IIIF Web-based approach as a way to literally unlock digital collections thanks to LD (Linked Data). From the concept of the capsa librarum, or of the bibliotheca – as the etymology of the word itself suggests – to the open and freely accessible library in the digital dimension.
3. Workshop plan
3. Programma del workshop
Trainer | Module | From | To | Topic/activity |
---|---|---|---|---|
Monella | Digital textual modelling | 11.00 | 11.20 | Concepts of model, formal model and digital model |
11.20 | 11.40 | Let's build a digital textual model: binary numbers, digital numbers, charsets (ASCII and Unicode), textual markup | ||
Monella | TEI XML | 11.40 | 11.50 | TEI (Text Encoding Initiative) XML |
11.50 | 13.00 | Encoding a portion of a manuscript in TEI XML based on the manuscript images | ||
Lunch break | 13.00 | 15.00 | ||
Cusimano | The Veneranda Biblioteca Ambrosiana | 15.00 | 15.15 | The Veneranda Biblioteca Ambrosiana and its new digital infrastructure |
Cusimano | Designing a new digital library devoted to manuscripts | 15.15 | 15.30 | Facing the preservation risks |
15.30 | 16.00 | Some good practices in digitization | ||
Cusimano | A new approach: IIIF - International Image Interoperability Framework | 16.00 | 16.20 | IIIF Core APIs: Image API & Presentation API |
16.20 |