Paolo Monella The distributed edition Semantic markup and LOD integration in TEI/XML editions with EVT Turin 2025

Paolo Monella L'edizione distribuita Marcatura semantica e LOD in edizioni XML/TEI con EVT Torino 2025

Italiano English

Dottorato Torino 2025

Details

Dettagli

Type Workshop
How In presence
Title The distributed edition: semantic markup and LOD integration in TEI/XML editions with EVT
Language Italian
Date April 2, 2025
Time 09:00-13:00
Institution DISH Center (Digital Scholarship in the Humanities) of the University of Turin, Italy
Part of Corso di Digital Humanities per i Dottorandi della Scuola di Scienze Umanistiche 2023-24, coordinated by Ermanno Malaspina, managed by Livio Bioglio
Tipo Workshop
Come In presenza
Titolo L'edizione distribuita: marcatura semantica e LOD in edizioni XML/TEI con EVT
Lingua Italiano
Data 2 aprile 2025
Ora 09:00-13:00
Istituzione Centro DISH (Digital Scholarship in the Humanities) dell'Università di Torino
Parte del Corso di Digital Humanities per i Dottorandi della Scuola di Scienze Umanistiche 2024-25, coordinato e diretto da Ermanno Malaspina, organizzato da Livio Bioglio

Presentazione del workshop

Workshop presentation

I contenuti e le competenze del workshop sono complementari a quelli della lezione di R. Rosselli Del Turco, di cui costituisce un approfondimento: dopo aver visto le basi della codifica XML/TEI (con la conseguente visualizzazione in EVT), procederemo adesso a codificare in XML/TEI named entities, ovvero persone, luoghi, organizzazioni e altri Realien con un referente preciso nella realtà storica del testo. Partendo da questa codifica ‘locale’ nel nostro testo, introdurremo i concetti di LOD (Linked Open Data) e le tecnologie del Web semantico: potremo così collegare la nostra marcatura XML/TEI con identificativi esterni e stabili delle named entities che abbiamo individuato nel testo.

The contents and skills covered in the workshop are complementary to those presented in the lecture by R. Rosselli Del Turco, of which this session represents an in-depth extension. After having explored the basics of XML/TEI encoding (with subsequent visualization in EVT), we will now proceed to encode in XML/TEI named entities, that is, people, places, organizations, and other Realien with a specific historical referent in the text. Starting from this ‘local’ encoding within our text, we will introduce the concepts of LOD (Linked Open Data) and Semantic Web technologies: this will allow us to connect our XML/TEI markup with stable external identifiers for the named entities we have identified in the text.

Attività e materiali

Schedule and materials

Per scaricare un file, clicca sul link col tasto destro e dai salva con nome (o equivalente).

To download a file: right-click, then save as (o equivalent).

Orario Time Attività Activity Materiali Materials
09:00-09:30 Introduzione Introduction
  • Autopresentazione del docente Teacher's self-introduction
  • Sito del corso Workshop website
  • Autopresentazione dei corsisti (progetti di ricerca; presenze) PhD students' self-introduction (research projects; attendance)
  • Perché un'edizione digitale? Perché i LOD? (Enti finanziatori; edizione distribuita) Why a digital edition? Why LOD? (Funding bodies; distributed edition)
09:30-09:40 Preparazione degli strumenti Tools setup
  • M1. Se non l'hai già fatto, scarica e installa uno dei seguenti editor (ma dovresti avere Visual Studio Code già installato dal workshop di R. Rosselli Del Turco): M1.If you haven't done it already, please donwload and install one of these editors (but you should have Visual Studio Code already installed from the R. Rosselli Del Turco workshop):
    1. Oxygen XML Editor (versione gratuita di prova) Oxygen XML Editor (free trial version)
    2. Visual Studio Code (editor di codice sorgente) con l'estensione Scholarly XML (vscode-sxml) di Raffaele Viglianti Visual Studio Code (code editor) with the extension Scholarly XML (vscode-sxml) by Raffaele Viglianti
    3. XML Copy Editor
09:40-10:00 Introduzione ai LOD (e integrazione con EVT) Introduction to the LOD (and EVT integration)
10:00-10:15 Pausa Break  
10:15-10:45 Laboratorio sull'integrazione TEI/LOD e visualizzazione in EVT: lettura codice e visualizzazione Hands-on activity on the TEI/LOD integration and on visualization in EVT: source code and visualization
  • M3. Marco Polo, exercise of TEI/LOD code reading on file evt_marco_polo/data/text/marcopolo.xml. Please find the elements with the following attributes: Marco Polo, esercizio di lettura del codice TEI/LOD, sempre sul file evt_marco_polo/data/text/marcopolo.xml. Trova gli elementi coi seguenti attributi:
    Element Attribute
    <person> xml:id="Adam"
    <persName> ref="#Adam"
    <person> xml:id="Balduin"
    <persName> ref="#Balduin"
    <person> xml:id="MP"
    <persName> ref="#MP"
    <person> xml:id="GrandChan"
    <persName> ref="#GrandChan"
  • M4. Visualization of semantic encoding in EVT: go to this EVT installation and click on named entities such as graunt Caam, graunt Ermenie, persse to see how they are rendered in EVT Visualizzazione della codifica semantica in EVT: vai su questa installazione di EVT e clicca su named entites come graunt Caam, graunt Ermenie, persse per vederne la resa in EVT
10:45-11:25 Laboratorio: come trovare i LOD URI per marcare 'manualmente' un testo con markup semantico Hands-on activity: how to find LOD URIs for 'manual' semantic markup
  • M5. Vai su Ancient Places in Pleiades per trovare l'URI LOD del toponimo “Gallia”
    • Clicca su “Advanced Search” (in alto a destra nella pagina)
    • Scrivi “Gallia” nel campo “Title” (non nel campo “Search Text”)
    • Scegli il risultato più pertinente e cliccaci sopra
    • Copia il valore del campo “Canonical URI for this page”
      • È un URI che inizia con https://pleiades
      • Questo è il nostro URI LOD per Gallia
  • M6. Abbiamo appena utilizzato Ancient Places in Pleiades. Altri “triple store” includono:
  • M5. Go to Ancient Places in Pleiades to find the LOD URI of place name “Gallia”
    • Click on “Advanced Search” (top right on the page)
    • Type “Gallia” in the “Title” field (not in the “Search Text” field)
    • Choose the best match and click on it
    • Copy the value of the “Canonical URI for this page”
      • It is a URI starting with https://pleiades
      • This is our LOD URI for Gaul
  • M6. We just used Ancient Places in Pleiades. Other “triple stores” include:
11:25-11:40 Pausa Break  
11:30-12:00 Discussione Discussion
12:00-13:00 Laboratorio: marcatura semantica assistita da Recogito Hands-on activity: semantic markup assisted by Recogito
  • M7. Login on Recogito
    • Create a free account if you don’t have one
  • M8. Download file debellogallico.xml to your computer
  • M9. Upload file debellogallico.xml to your Recogito workspace:
    • “New” (blue button, top left)
    • “File upload” → choose and upload file debellogallico.xml from your computer
  • M10. Ask Recogito to assist you in marking up the place name “Gallia”
    • Double-click on debellogallico.xml from the Recogito file list
      • The debellogallico.xml file opens up in Recogito (markup is hidden). Please note that Recogito has already identified a number of words as named entities, and has highlighted them.
      • Keep the default settings:
        • “Annotation mode: Normale/Normal”
        • “Colori/Colors: Per stato di verifica”
    • Highlight word “Gallia” (from the sentence “Gallia est omnis divisa…”)
    • Click on “Luogo/Place”
      • Recogito suggests a LOD URI (from Pleiades)
    • Check if it is correct
    • If it is, click on “OK” or “OK e successivo”
      • Recogito asks: “There is 1 more un-annotated occurrence of Gallia in the text. Do you want to re-apply this annotation?”
      • I suggest answering “Yes”
  • M11. Mark up population names (such as “Belgae”)
    • (We are assuming that debellogallico.xml is still open in Recogito)
    • Again, click on “Luogo/Place”
    • Issue: Recogito suggests to link “Celtae” and “Galli” (populations) to the LOD URI of place “Gallia”. Is this what we want? We can talk about it…
  • M12. Mark up the person name “Orgetorix”
    • (We are assuming that debellogallico.xml is still open in Recogito)
    • This time, click on “Persona/Person”
    • …but it does not suggest a LOD URI
  • M13. Recogito data visualizations
    • Click on the “Annotation Statistics” icon on top
    • Click on the “Map View” icon on top
  • M14. Download the annotated file
    • Click on the download icon on top
    • Choose the format
      • We can discuss what those formats mean
      • But on this occasion, we’ll choose “Annotated Document → TEI → TEI/XML” (blue button on the right)
  • M15. Check the TEI/XML markup produced by Recogito
    • Open with your installed XML editor the file you downloaded from Recogito
  • M7. Accedi a Recogito
    • Crea un account gratuito se non ne hai già uno
  • M8. Scarica il file debellogallico.xml sul tuo computer
  • M9. Carica il file debellogallico.xml nel tuo spazio di lavoro su Recogito:
    • “New” (pulsante blu, in alto a sinistra)
    • “File upload” → seleziona e carica il file debellogallico.xml dal tuo computer
  • M10. Usa Recogito per annotare il nome di luogo “Gallia”
    • Fai doppio clic su debellogallico.xml dalla lista file di Recogito
      • Il file debellogallico.xml si apre in Recogito (il markup è nascosto). Nota che Recogito ha già identificato alcune parole come entità nominate, e le ha evidenziate.
      • Mantieni le impostazioni di default:
        • “Annotation mode: Normale/Normal”
        • “Colori/Colors: Per stato di verifica”
    • Evidenzia la parola “Gallia” (dalla frase “Gallia est omnis divisa…”)
    • Clicca su “Luogo/Place”
      • Recogito suggerisce un URI LOD (da Pleiades)
    • Controlla che sia corretto
    • Se lo è, clicca su “OK” oppure “OK e successivo”
      • Recogito chiede: “There is 1 more un-annotated occurrence of Gallia in the text. Do you want to re-apply this annotation?”
      • Suggerisco di rispondere “Yes”
  • M11. Annota i nomi di popolazioni (come “Belgae”)
    • (Supponiamo che debellogallico.xml sia ancora aperto in Recogito)
    • Clicca nuovamente su “Luogo/Place”
    • Problema: Recogito suggerisce di collegare “Celtae” e “Galli” (populations) all’URI LOD del place “Gallia”. È quello che vogliamo? Possiamo discuterne…
  • M12. Annota il nome di persona “Orgetorix”
    • (Supponiamo che debellogallico.xml sia ancora aperto in Recogito)
    • Questa volta clicca su “Persona/Person”
    • …ma Recogito non suggerisce alcun URI LOD
  • M13. Visualizzazioni dei dati in Recogito
    • Clicca sull'icona “Annotation Statistics” in alto
    • Clicca sull'icona “Map View” in alto
  • M14. Scarica il file annotato
    • Clicca sull'icona di download in alto
    • Scegli il formato
      • Possiamo discutere sul significato di questi formati
      • Ma in questa occasione scegliamo “Annotated Document → TEI → TEI/XML” (pulsante blu sulla destra)
  • M15. Controlla il markup TEI/XML prodotto da Recogito
    • Apri con il tuo editor XML installato il file che hai scaricato da Recogito

Credits