Francesca Capochiani, Leoni Chiara, Roberto RosselliDelTurco, Codifica, pubblicazione e interrogazione sul web di corpora diplomatici per mezzo di strumenti open source
La consultazione di testi diplomatici costituisce uno strumento di lavoro insostituibile per gli storici e gli archivisti. La loro disponibilità online offre il massimo della flessibilità e della diffusione, permettendo allo studioso di accedere a questo materiale prezioso senza barriere spaziali o temporali: alcuni progetti, come The Electronic Sawyer (http://www.esawyer.org.uk/) e l’attività della École Nationale des Chartes (http://www.enc.sorbonne.fr), mostrano come sia possibile offrire testi di alta qualità scientifica sul web usando una codifica XML delle fonti. La loro creazione, tuttavia, richiede risorse non indifferenti: è possibile digitalizzare e mettere online questo materiale, per le proprie ricerche e per il beneficio della comunità accademica, in maniera (relativamente) semplice ed efficace? Inoltre una pubblicazione sul web è incompleta se non consente un’agevole consultazione e il data mining delle risorse offerte: come facilitare l’accesso e la ricerca all’interno dei testi? Questo intervento si propone di mostrare come, grazie all’uso di software open source, il singolo studioso o un piccolo team di ricercatori possa digitalizzare un corpus di documenti usando il formato TEI (http://www.tei-c.org/), pubblicarlo sul web e inserire nell’interfaccia un motore di ricerca come eXist (http://exist-db.org/) o XTF (http://xtf.cdlib.org/) per effettuare ricerche complesse. Fonte: https://iris.unito.it/handle/2318/147019?mode=full.36
Paolo Monella Curriculum
DH bibliography
Paolo Monella home page