Paolo Monella, Università di Palermo

Edizioni critiche digitali,
XML e letterature classiche


L'edizione scientifica digitale

Cinzia Pusceddu al CLiP 2001: una storia della filologia elettronica

Vedi l'abstract dell'intervento di Cinzia Pusceddu a Computers, Literature, Philology, Seminario Internazionale (6-9 dicembre 2001, Gerhard-Mercator-Universität Duisburg).

0. Edizioni non scientifiche (codifiche procedurali)

1. Modi diversi dall'XML/TEI di codificare in modo digitale la varianza testuale (soprattutto tramite codifiche procedurali)

Si tratta dei progetti che compongono la sezione "B1" della rassegna qui di seguto ovvero Edizioni scientifiche condotte con metodologia tradizionale, i cui soli risultati sono presentati in formato digitale.

2. La codifica XML/TEI - modulo Critical Apparatus

Vd. la sezione relativa (cap. 19) delle Guidelines P5.

Il livello di presentazione della varianza testuale arriva fino alla lezione ("reading"), ovvero parola normalizzata.

La "lezione" è rappresentabile attraverso una sequenza di caratteri ASCII, incluse eventualmente entità che rappresentino glifi, quali &a-; per una 'a' sormontata da un trattino, usata in sistemi scrittori di ambito germanico medievale. A questo livello di formalizzazione, però, potremo dire più precisamente che tali entità non rappresentano glifi (ovvero 'tokens', contingenti realizzazioni grafiche di un grafema), ma grafemi ('types).

Tramite software apposito, è possibile rendere conto al fruitore dell'edizione critica digitale delle operazioni ermeneutiche dell'editore da questo livello (le "lezioni" attestate nella tradizione) fino al testo da lui (eventualmente) proposto.

Ecco un esempio di questo tipo di markup:

 <app>
  <rdg wit="#El">Experience though noon Auctoritee</rdg>
  <rdg wit="#La">Experiment thogh noon Auctoritee</rdg>
  <rdg wit="#Ra2">Eryment though none auctorite</rdg>
 </app>

3. La codifica XML/TEI - modulo Transcription of Primary Sources

Anche qui vd. la sezione relativa (cap. 19) delle Guidelines P5.

Il lavoro sui due moduli (Critical Apparatus e Transcription of Primary Sources) è stato svolto da due commissioni separate: Peter Robinson ha presieduto quella relativa al Textual Criticism (d'ora in poi, per brevità, TEI/Apparatus), Claus Huitfeld quella relativa alla Trasncription of Primary Sources (d'ora in poi TEI/Transcription). In seguito, però, il lavoro delle due commissioni ha proceduto in modo sempre più collaborativo, fino a che i due responsabili non hanno preso a collaborare personalmente alla messa a punto finale di entrambe le sezioni. Di queste fasi dà nota lo stesso Peter Robinson in: Robin C. Cover, Peter M. W. Robinson, Encoding textual criticism, "Computers and the Humanities", Volume 29, Issue 2, Mar 1995, Pages 123 - 136.

Se si sceglie di trascrivere (e descrivere) i singoli testimoni, facendo di fatto un'edizione diplomatica elettronica di ciascuno, usando i marcatori del modulo TEI/Transcription, il livello di presentazione della varianza testuale si spinge fino al livello dei glifi e della loro organizzazione nello spazio fisico del manoscritto, ovvero al livello dellarealizzazione grafica della scrittura sul supporto fisico del testimone.

Sempre per mezzo di un software di interfaccia, al fruitore dell'edizione critica digitale è possibile rendere conto di fenomeni grafici come abbreviazioni, lettere poco leggibili, cambiamenti di mano, inserzione di porzioni di testo in margine, tra le righe, cancellature e correzioni, dando conto della varianza testuale anche a questo livello.

Ad esempio, se due manoscritti presentassero entrambi la lezione 'pervicax' ma l'uno (A) abbreviando 'per' (ad esempio col glifo spesso rappresentato in ambito TEI con &p-underbar; ovvero una 'p' con l'asta inferiore tagliata da una lineetta trasversale), l'altro (B) non abbreviando, tale livello di varianza testuale sarebbe codificabile. La trascrizione di questo passaggio in A sarebbe infatti:

<abbr expan="per" cert="0.6" resp="PM">&p-underbar;</abbr>vicax

Mentre la trascrizione della porzione corrispondente di B sarebbe semplicemente:

pervicax

Nell'esempio precedente, abbiamo codificata altra informazione importante: tramite l'uso degli attributi cert e resp abbiamo indicato che, possibilmente per motivi di scarsa chiarezza della scrittura del manoscritto A o di un danneggiamento del supporto in quel punto, il responsabile della trascrizione del manoscritto A (PM, Paolo Monella) è sicuro solo al 60% dello scioglimento dell'abbreviazione. Si tratta di informazioni che possono risultare importanti per l'editore e per il fruitore dell'edizione critica, al momento della valutazione comparativa delle varianti testuali.

Problemi teorici nella mescolanza tra i due set di marcatori

I due set di marcatori (TEI/Apparatus e TEI/Trascription) possono essere usati nello stesso documento. Ad esempio, in un file XML/TEI contenente un'edizione critica, è possibile, in casi di lettura particolarmente problematica del manoscritto, annidare nell'elemento <rdg> un 'pezzo di trascrizione di un manoscritto', realizzato con tags presi da TEI/Transcription. Nell'esempio seguente indichiamo, nel file XML di un'edizione critica, che il testimone A legge 'p(er)vicax', con abbreviazione iniziale, il testimone B 'pervicax' senza abbreviazione:


vere
  <app>
    <rdg wit="A">
      <abbr expan="per" cert="0.6" resp="PM">&p-underbar;</abbr>vicax
    </rdg>
    <rdg wit="B">
      pervicax
    </rdg>
  </app>
sum

A livello di riflessione teorica, in realtà, tale commistione apre delle smagliature nel modello di rappresentazione testuale della varianza testuale della TEI: l'oggetto della rappresentazione non è più la "lezione" (intesa come parola graficamente normalizzata), ma la realizzazione grafica di tale parola sulla pagina del manoscritto, anzi più ancora in profondità l'aspetto fisico del testimone (si pensi all'esempio di una parola aggiunta a margine: non stiamo descrivendo solo i glifi di cui è composta, ma la posizione all'interno dello spazio fisico della pagina). Ma, come più volte segnalato da studiosi europei, ad esempio da Tito Orlandi anche di recente, il team della TEI sembra mancare di una profonda attenzione agli aspetti teorico/metodologici della codifica testuale digitale.

Ancora maggiore è la confusione teorica quando elementi di TEI/Apparatus vengono inseriti all'interno di files XML contenenti trascrizioni di manoscritti. In questo caso, il tag <rdg> indica non una "lezione" presa da un testimone A (<rdg wit="A">), ma, all'interno del manoscritto che si sta trascrivendo, una possibile "lettura" (interpretazione) da parte del trascrittore di un segno grafico poco chiaro (<rdg resp="PM" cert="0,8">). Anche il seguente esempio, come i precedenti, è preso dalla versione P5 delle TEI Guidelines, e va immaginato come un frammento di un file XML contenente la trascrizione di un manoscritto:

Virginite is grete

<app>
  <rdg resp="#ES">perfecti<abbr>oi</abbr>
  </rdg>

  <rdg xml:id="f105" resp="#FJF">perfectio<expan>u</expan>n</rdg>
  <rdg xml:id="r105" resp="#PGR">perfectiou<expan>n</expan>

  </rdg>
 </app>
<!-- ... <note> appearing elsewhere in the document ... -->

 <note target="#r105 #f105">Furnivall's expansion implies that the bar
   is an abbreviation for 'u'. There are no certain instances of
   this mark as an abbreviation for 'u' in these MSS and it is
   widely used as an abbreviation for 'n'. Ruggiers' expansion is to
   be accepted.</note>

Trascrizione dei testimoni ed immagini digitali

Per il momento, possiamo mettere anche noi tra parentesi i nodi non risolti a livello teorico, soprattutto per il primo caso (elementi di trascrizione contenuti in elementi <rdg> all'interno di files XML contenenti edizioni critiche), pensando a livelli diversi, più o meno profondi, di formalizzazione. Possiamo pensare semplicemente che in un'edizione critica in formato XML, un frammento di codice del tipo

  <rdg xml:id="f105" resp="#FJF">perfectioun</rdg>

assuma, ad un livello di rappresentazione più 'alto', la "lezione" (parola normalizzata) perfectioun, mentre un altro frammento di codice (anche all'interno dello stesso file XML) come

  <rdg xml:id="f105" resp="#FJF">perfectio<expan>u</expan>n</rdg>

'scende' ad un livello di rappresentazione più profondo, e (poiché l'editore l'ha ritenuto utile) assume temporaneamente come oggetto da rappresentare la specifica realizzazione grafica della "lezione" perfectioun nel codice.

La possibilità di aggiungere all'edizione critica digitale immagini riproducenti le fonti primarie (iscrizioni, papiri o manoscritti) permette di scendere ancora più in profondità, nel livello di informazioni relative alla tradizione testuale offerte all'editore e al fruitore dell'edizione critica: dalla rappresentazione dei fenomeni grafici tramite marcatori ed entità XML, all'immagine digitale del testimone parcellizzata (tramite procedure standard codificate anch'esse in XML) in aree rappresentanti porzioni testuali. In pratica, viene realizzato un file XML di descrizione dell'immagine, che suddivide quest'ultima in porzioni (normalmente rettangolari), identificate univocamente. In questo modo sarà possibile, all'interno del file XML contenente la normale trascrizione del testimone, istituire un collegamento tra i punti della trascrizione e le aree corrispondenti dell'immagine.

4. Il 'testo plurale'. Markup TEI/Apparatus Criticus e teorie testuali: L'esempio dell'elemento <lem>

Le specifiche TEI per la rappresentazione digitale della varianza testuale nascono da, e costituiscono sostanzialmente, una riproposizione nel medium elettronico dell'impostazione tradizionale della filologia testuale: dare notizia della variabilità del testo nei suoi testimoni, documentare e argomentare i passaggi interpretativi del processo ecdotico, ma alla fine stabilire un testo dell'editore (il più possibile vicino al testo 'giusto', ovvero al testo dell'autore).

La neutralità del markup TEI rispetto alle diverse teorie testuali è un obiettivo degli sviluppatori dello standard (vd. Robin C. Cover, Peter M. W. Robinson, Encoding textual criticism, "Computers and the Humanities", Volume 29, Issue 2, Mar 1995, Pages 123 - 136). Per questo motivo il markup proposto nel modulo Apparatus Criticus della TEI può conciliarsi con concezioni anche molto diverse della testualità. Può essere interessante, al riguardo, riflettere sulle implicazioni teoriche dell'elemento <lem> dal punto di vista della relazione tra testo 'dell'editore' e testo relegato in apparato (vd. la sezione Linking the Apparatus to the Text delle Guidelines P5).

Un discrimine importante, a livello di concezione della testualità e della varianza testuale, è costituito dalla presenza o no, all'interno delle varianti ("readings") attestate nella tradizione, di un testo scelto dall'editore (marcato in XML/TEI come <lem>. In altre parole: l'editore sceglie di presentare una delle varianti presenti nella tradizione come il testo 'giusto', il suo testo, quello che ha più probabilità di avvicinarsi alla volontà dell'autore, o di presentare tutte le varianti sullo stesso piano, secondo una concezione 'aperta' del fenomeno della varianza testuale?

Il 'Lemma' è definito nella bozza delle nuove Guidelines TEI P5 come

The reading accepted as that of the original or of the base text. [...] Those who prefer to work without the notion of a base text may prefer not to use it [the <lem> element] at all.

Come sappiamo, l'apparato può essere collegato al testo con metodi diversi, e in particolare può essere posto "in-line" o in una sezione (o file!) a parte. Si confrontino i seguenti casi.

1. Apparato 'negativo'. La variante accettata ricorre solo nel testo, come contenuto diretto dell'elemento <div>, fuori dall'<app>. Massimo dell'effetto 'testo unico':


 <div n="1.1">Testo con una variante soltanto
 testuale</div>

 <!--Altro testo--> 

  <app loc="1.1">
   <rdg wit="#B #C">variazione</rdg>
   <rdg wit="D">lezione</rdg>
  </app>

2. Lo stesso esempio può essere leggermente variato in modo da costituire un apparato 'positivo'. Il lemma ricorre sia nel testo sia nell'. In questo modo si può identificare esattamente il punto che presenta variazione testuale, ma come concezione del testo siamo allo stesso punto, in quanto la variante accettata è direttamente riportata nel testo. Le Guidelines P5 permettono di non indicare neppure i codici in cui ricorre la variante accettata nel testo dell'editore (da questo punto di vista, non si può dire, a rigore, che l'esempio che segue costituisca propriamente un apparato 'positivo'). Il 'lemma' costituisce dunque solo un 'pointer' per collegare testo ed apparato:


 <div n="1.1">Testo con una variante soltanto testuale</div>

 <!--Altro testo--> 

  <app loc="1.1">
   <lem>variante</lem>
   <rdg wit="#B #C">variazione</rdg>
   <rdg wit="D">lezione</rdg>
  </app>

2a. Nell'ottica del lemma come 'pointer', sostanzialmente rivolto all'uomo che legge l'apparato in una presentazione su schermo (e solo in prospettiva molto remota ad un programma in grado di identificare così il punto del testo interessato dalla variazione testuale), nelle Guidelines "non è proibito" abbreviare il lemma (scrivendo, nel nostro esempio, var. al posto di variante):


 <div n="1.1">Testo con una variante soltanto testuale</div>

 <!--Altro testo--> 

  <app loc="1.1">
   <lem>var.</lem>
   <rdg wit="#B #C">variazione</rdg>
   <rdg wit="D">lezione</rdg>
  </app>

3. Compiamo solo un piccolo passo nella direzione dell'"uguaglianza" tra le varianti se all'esempio precedente aggiungiamo i testimoni che presentano la lezione accettata:


 <div n="1.1">Testo con una variante soltanto
 testuale</div>

 <!--Altro testo--> 

  <app loc="1.1">
   <lem wit="#A">variante</lem>
   <rdg wit="#B #C">variazione</rdg>
   <rdg wit="D">lezione</rdg>
  </app>

4. In tutti gli esempi precedenti il lemma era incluso del testo (ed era o non era presente in apparato). Che il lemma sia presente nel testo è richiesto nei metodi di collegamento tra testo ed apparato 'Location-referenced' e 'double-end point'. Immaginiamo ora un caso diverso, nel quale la variante accettata non costituisce il contenuto diretto dell'elemento <div>, bensì è dentro l'<app>, insieme alle altre. In questo caso, il suo statuto 'privilegiato', è ancoramarcato dalla presenza dell'elemento <lem>. Un po' meno 'testo unico', ma c'è comunque l'indicazione di un testo rispetto agli altri. Si noti che il seguente esempio può essere realizzato solo se si sceglie (e si dichiara nel TEI Header) il 'Parallel segmentation method' per il rapporto testo-apparato. Di fatto testo ed apparato non vanno più 'collegati', in quanto l'<app> costituisce a tutti gli effetti parte integrante del testo (questo sarà ancora più evidente nell'esempio 6, più avanti):


 <div>Testo con una
  <app>
   <lem wit="#A">variante</lem>
   <rdg wit="#B #C">variazione</rdg>
   <rdg wit="D">modificazione</rdg>
  </app>
 testuale</div>

5. Sempre rimanendo all'interno del ventaglio delle possibilità offerte dall'XML/TEI, possiamo infine configurare una codifica in cui tutte le varianti vengano 'livellate' dall'elemento <rdg>, dentro <app>. Siamo nell'ambito del 'Parallel segmentation method', ed è evidente come l'apparato (la variazione testuale) faccia ormai parte integrante del testo: non esiste un testo-base, virtualmente indipendente dall'apparato. Il lettore-interprete deve fare i conti con la variazione testuale. Questo costituisce il massimo nella direzione del 'testo plurale':


 <div>Testo con una
  <app>
   <rdg wit="#A">variante</rdg>
   <rdg wit="#B #C">variazione</rdg>
   <rdg wit="D">modificazione</rdg>
  </app>
 testuale</div>

5a. In quest'ultimo caso è possibile arricchire l'apparato con una discussione dell'editore/codificatore sulle diverse varianti, dove troverebbe spazio l'indispensabile intervento 'scientifico' del filologo testuale. Tale discussione potrebbe essere ospitata da un elemento <note>, e i suoi risultati potrebbero essere formalizzati, all'interno dei tags <rdg>, tramite gradi di certainty dei readings, di cui l'editore si prende (tramite l'attributo resp) la responsabilità:


 <div>Testo con una
  <app id="a001" resp="PM">
   <rdg wit="#A" cert="0.80">variante</rdg>
   <rdg wit="#B #C" cert="0.15">variazione</rdg>
   <rdg wit="D" cert="0.05">modificazione</rdg>
  </app>
 testuale</div>

  <note target="a001">
    La lezione di A è preferibile per i
    seguenti motivi... anche in considerazione
    dell'<hi rend="it">usus scribendi</hi> dell'autore:
    cfr. i seguenti passi... Convince meno l'ipotesi di <bibl>M.
    Rossi, <title>...</title></bibl>, il quale difende
    <q>variazione</q> in quanto <hi rend="it">lectio
    difficilior</hi>...
  </note>

Nel caso in cui la lista dei testimoni (e il markup relativo alle lacune e ai testimoni frammentari) siano ben curati e 'completi', le considerazioni precedenti valgono meno. In questo caso, infatti, che il lemma sia ripetuto in apparato o no (apparato 'positivo' o 'negativo') è del tutto indifferente. E' infatti sempre possibile, da parte della macchina, ricostruire quali testimoni riportano la lezione accettata (il 'lemma'): si tratta, all'interno dei testimoni che riportino quella porzione di testo, di quelli che non vengono citati in apparato.

L''indice di pluralità testuale' veicolato dal markup può dunque essere così riformulato:

  1. Edizioni elettroniche che non riportino una lista completa di testimoni, e che rientrino nei casi 1-2 ipotizzati sopra (in un punto, le Guidelines accennano alla possibilità di questo caso: davvero, i responsabili della TEI vogliono venire incontro a tutti...);
  2. Edizioni elettroniche che non riportino una lista completa di testimoni, ma rientrino nei casi 3-4, ed edizioni elettroniche che riportino una lista completa di testimoni che rientrino (quasi indifferentemente) in uno dei casi dall'1 al 4. Il "quasi indifferentemente" è legato ad un discrimine prevalentemente simbolico: la scelta di includere la lezione accettata direttamente nel testo edito (come contenuto diretto dell'elemento <div>) o no. In ogni caso, la presenza dell'elemento <lem> determina un testo di statuto 'privilegiato', scelto dall'editore/codificatore, e questo è un elemento che accomuna i casi 1-4. Eppure una differenza importante tra i casi 1-3 ed il 4, determinata dalla scelta del 'Parallel segmentation method', esiste: la scelta di questo metodo implica che di fatto il testo, senza l'apparato, non sia completo. Certo, un'applicazione può facilmente 'integrare' il testo incompleto prendendo il lemma dall'apparato, ma si tratta comunque di un'operazione da svolgere a livello di elaborazione del testo. I due altri metodi, per parte loro, presuppongono un testo sostanzialmente indipendente dall'apparato: quest'ultimo è un optional che può infatti trovarsi anche in un file separato, e può essere aggiunto in un secondo momento (in un file separato, appunto) ad un file già marcato senza alcuna attenzione all'aspetto delle varianti testuali (ad es. tramite il metodo del 'Double-ending Attachment', usato con riferimenti complessi ai punti precisi del file contenente il testo 'non critico').
  3. Edizioni elettroniche che rientrino nel caso 5 sopra ipotizzato.

Va da sè, naturalmente, che un foglio di trasformazione XSLT, o un software di elaborazione dell'XML, può "ovverride" le implicazioni teorico-testuali dell'elemento <lem>, e porre tutte le <rdg> sullo stesso piano. Ma dall'avvicinamento della lente dell'osservazione all'effettivo codice TEI emergono due considerazioni generali:

5. Il testo 'fluido' e l'edizione come database

I punti di debolezza dell'XML/TEI come metodo per rappresentare i testi sono riassumibili in due punti fondamentali:

  1. In generale, le restrizioni imposte dalla sintassi formale SGML (nidificazione e impossibilità di rappresentare gerarchie concorrenti);
  2. In particolare, per quanto riguarda la varianza testuale, la possibilità di fatto di rappresentare, con le procedure della TEI/Apparatus Criticus, solo variae lectiones a livello di lettera, parola o piccole porzioni di testo.

Abbiamo visto come, ancora 'all'interno' del markup TEI, sia possibile rappresentare varianti testuali di porzioni non troppo estese di testo in modo 'aperto', senza privilegiare una lezione nei confronti di un'altra. Tramite l'uso del tag <app> ed un collegamento 'in-line' tra testo ed apparato, diventa anzi possibile (superando le restrizioni imposte dal medium cartaceo) pubblicare un testo secondo una concezione 'aperta' della testualità e della varianza.

Quando però la varianza testuale diventa più estesa e radicale, e si tratta di pubblicare testi a tradizione 'fluida', in cui ogni manoscritto differisce notevolmente dall'altro, si presenta la necessità di applicare nuove tecniche, diverse dalla stampa ed anche dal markup TEI/Apparatus Criticus. Tecnologie basate su DBMS, Database Managment Systems.

Dino Buzzetti, storico della filosofia antica e teorico dell'e-philology, ha proposto riflessioni interessanti al riguardo. Vd. ad esempio il suo articolo negli atti del convegno Soluzioni informatiche e telematiche per la filologia, Pavia, 30-31 marzo 2000 (a c. di Simone Albonico) per l'aspetto puramente teorico (i problemi del markup SGML-based in termini di interferenza tra struttura dell'espressione - le limitazioni SGML - e struttura del contenuto).

In un'intervista del 1995 rilasciata alla trasmissione Rai Mediamente, Buzzetti poneva così la questione:

Lo strumento informatico non è tanto uno strumento pratico per aiutare nel modo tradizionale in cui si preparano le edizioni, per esempio, per produrre un testo stampato con diversi livelli di note di apparato dell'edizione critica. Non è in questo senso. Esistono sistemi molto sviluppati, per fare questo tipo di lavoro. Invece ci si è presentata la necessità di usare l'informatica di fronte ad un problema filologico del testo, che non poteva essere risolto con altri mezzi. Avevamo dei testi a tradizione, cosiddetta "fluida", ciascuna copia manoscritta diversa dall'altra e quindi non confrontabile, non collazionabile con le tecniche classiche. La risposta ovvia è stata creare un database contenente sia le trascrizioni, sia le immagini digitali delle fonti manoscritte.

L'applicazione delle sue teorie è rappresentata dalla sua edizione di opere di insegnamento universitario della Bologna del '300, per la quale è stato utilizzato il DBMS 'Kleio', sviluppato da Manfred Thaller, del Max-Planck-Institut fuer Geschichte di Goettingen. Vd. ad es. D. Buzzetti, P. Pari, A. Tabarroni, Libri e maestri a Bologna nel XIV secolo: un’edizione come “database”, in "Schede Umanistiche”, n.s. II, 2, 1992, pp. 163-169. Non è questa, comunque, l'unica sua pubblicazione al riguardo: vd. qui una selezione della sua bibliografia. Tra le sue pubblicazioni scaricabili online, vd. Database Edition of Non-collatable Textual Tradition , in The Electronic Scriptorium (1997).

Come esempi di testi fluidi, Buzzetti cita:

  1. La tradizione medievale di testi come il Chevalier de la Charrette di Chrétien de Troyes, per cui rimanda all'edizione di Princeton, realizzata appunto come database. A tal proposito, nell'intervista citata prima, dice:
  2. L'edizione critica risulta, rispetto a questo tipo di testualità, un'invenzione dell'editore, un editore ottocentesco o attuale. Come fare ricerche lessicali sull'uso delle espressioni dialettali, sul rapporto tra diversi usi linguistici, lavorando su di un materiale costruito artificialmente e non rifacendoci alle fonti originali? Quindi il database può essere una forma di rappresentazione adeguata di forme di testualità diverse da quella canonizzata dal libro a stampa.
  3. Il secondo campo di applicazione che egli individua sono "i manoscritti dell'autore lasciati incompiuti".

Fondamentale il passaggio dell'intervista a Mediamente in cui Buzzetti definisce i criteri in base ai quali un archivio delle fonti documentarie diventa un'edizione (enfasi mia):

Allora quali requisiti deve avere questa forma di rappresentazione, per potere essere considerata una edizione? Secondo noi, introdurre procedure computazionali, che svolgano su questo materiale la stessa funzione che in una edizione critica svolge l'apparato, un filtro per potere filtrare l'informazione e presentare un'opzione possibile, ma un'opzione sempre rivedibile, perché consente il confronto diretto con la fonte.

Molto importante, nel modello di Buzzetti, è che il database presenti l'immagine accanto al testo. Si tratta della stessa linea di indagine su cui al convegno "Digital Philology and Medieval Texts" di Arezzo Arianna Ciula ha impostato il suo workshop.

Un problema identificato da Buzzetti (sempre nell'intervista a Mediamente) è costituito dalla standardizzazione dei formati:

Quindi occorre prevedere dei meccanismi di esportazione o importazione tra diversi sistemi, in modo da potere utilizzare i dati con la forma strutturata, che è stata loro attribuita da chi li ha elaborati. Scambiare le trascrizioni, in quanto tali, o scambiare le immagini, è relativamente semplice. Quello che non si riesce allo stato attuale a scambiare è il modo in cui noi le abbiamo organizzate. Questo comporta lo sviluppo di un certo formato del file, che consente il travaso, per esempio, di un'immagine, insieme con tutta la descrizione logica del suo contenuto, un'immagine insieme con la trascrizione.

Riassumendo, se il markup TEI/Transcription può risultare comunque prezioso per trascrivere i singoli testimoni, al momento della realizzazione dell'edizione critica (cioé di un'edizione che dia conto, in qualche modo, della varianza testuale) si aprono all'editore due strade, a seconda della sua concezione della testualità, ma anche del livello di varianza del testo in esame:

  1. Creare un file XML secondo il modulo TEI/Apparatus Criticus, che è sostanzialmente la rappresentazione di un modello unitario del testo, ovvero di un testo, con delle varianti riguardanti limitate;
  2. Creare un database che colleghi le trascrizioni (anche XML/TEI) dei singoli testimoni tra di loro, ed eventualmente con le immagini digitali a loro relative.

Paolo Monella, Università di Palermo

Un panorama delle iniziative
di filologia digitale

NB: molti di questi progetti sono recensiti dalla dott.ssa Cinzia Pusceddu sul sito Digital Variants. Le citazioni tratte dalle sue schede sono qui di seguito marcate in corsivo.

A. Edizioni digitali non scientifiche

A1. Edizioni non scientifiche e archivi testuali, basati sulla digitalizzazione di edizioni cartacee, con apparato multimediale (immagini ed altro)

Oxford Text Archive (Lou Burnard)
Si segnala in quanto costituisce di uno dei maggiori archivi mondiali di testi letterari, ed uno dei primi ad essere stati codificati in XML/TEI. Ma comunque non si tratta di edizioni critiche.
La BIT, Biblioteca Italiana Telematica (online)
La TEI applicata al più grande corpus di testi italiani online. Il sito è collegato al portale Internet culturale.
Le sue specifiche tecniche dichiarano che i testi sono tutti conformi alla TEI, a due livelli di 'profondità' del markup già realizzati (ma i livelli previsti sono cinque, laddove 5 è l'edizione critica elettronica). Al progetto lavora anche Fabio Ciotti. Costituisce un esempio di come anche un corpus di testi elettronici non marcati in modo dicharativo (quali per esempio database come TLG e BTL) possano essere successivamente adeguati agli standard più avanzati della filologia digitale.
Clicca qui per una presentazione del progetto da parte del dott. Tavosanis.
Life and Times di Chaucer (offline)
Basata su un'edizione cartacea recente, con foto dei manoscritti ed altro.
Trobadors: concordanze della lirica trobadorica (offline)
Il corpus della poesia occitanica secondo il Répertoire métrique di István Frank, basato sulle edizioni maggiormente accreditate o recenti.
Si tratta di un archivio testuale. Qualcosa di simile a basi di dati come TLG, PHI5 o BTL. Senza immagini nè alcun riferimento alle fonti primarie.
Letteratura Italiana Einaudi (offline)
Archivio in 10 CD-ROM comprendente: testi integrali dei maggiori autori della letteratura italiana.
Nessun riferimento alle fonti primarie. È presente un apparato multimediale, ma non in funzione critico-testuale.
Virginia Woolf (offline)
Archivio dell’opera completa di Virginia Woolf, in diverse edizioni a stampa e inclusi diari e saggi. Oltre ai testi, anche le immagini di manoscritti, diari, lettere, una registrazione audio della voce della scrittrice e uno studio critico recente, Virginia Woolf A-Z, del curatore dell’edizione elettronica.
Digital Dante (online)
Archivio testuale multimediale.
Gustave Flaubert (online)
Archivio testuale mutimediale.
Dante online (online)
Archivio testuale multimediale.
Electronic Text Center (online)
All’ETC dell’Università della Virginia, archivio di testi elettronici online e offline, codificati in SGML e XML, abbinati a immagini e raggruppati per categoria linguistica. A disposizione degli utenti anche fornitura di hardware e software per la produzione e l’analisi di testi.
Si tratta di testi non critici: non c'è descrizione dei testimoni, né apparato critico.
Schoenberg Center of Electronic Text and Image (online)
Archivio all’Università della Pennsylvania comprendente dipinti, lettere, manoscritti, testi a stampa di autori vari, noti o anonimi.
Anche qui si tratta di testi non critici: non c'è descrizione dei testimoni, né apparato critico. La loro attività è rivolta soprattutto alla scansione (e, a quanto pare, all'OCR) di testi a stampa.

B. Edizioni digitali scientifiche

B1. Edizioni scientifiche condotte con metodologia tradizionale, i cui soli risultati sono presentati in formato digitale

Zwingli (offline)
Il progetto è di pubblicare tutta l'opera di Zwingli. I testi sono basati su edizioni critiche cartacee precedenti e corredati di apparato. Sono incluse alcune immagini di manoscritti.
The Confessions of Augustine: An Electronic Edition (online)
Pusceddu la riporta tra le edizioni 'scientifiche', ma in realtà non c'è apparato critico. Il testo è stato codificato in SGML/TEI da un'edizione cartacea (di J. J. O’Donnel) con commento in inglese. Al progetto ha partecipato lo Stoa Consortium.
N. Canussio, De restitutione Patriae (online)
Riproduzione elettronica dell’edizione critica a stampa pubblicata nel 2000 dalla Fondazione Canussio. Il testo latino (note di apparato sensibili) è in frame alla traduzione in italiano (note critiche sensibili) e dall’indice si può aprire la corrispondente immagine dell’autografo.
Sono state aggiunte (alcune) immagini di uno dei due manoscritti importanti per l'edizione. Ma testo ed apparato sono separati, collegati da semplici rimandi in HTML.
The World of Dante (online)
Archivio contenente l’Inferno di Dante, realizzato da D. Parker allo IATH dell’Università della Virginia. Dal testo critico in italiano (ed. Petrocchi), marcato SGML, si accede alle informazioni codificate per parola o frase (asterischi), alla traduzione in inglese per terzine (numeri), a illustrazioni (frecce).
Oltre a riportare l'apparato critico, costituisce un archivio multimediale.
Rialc. Repertorio informatizzato dell’antica lirica catalana (online)
I testi sono basati su edizioni critiche eccellenti, in parte ritoccate; imperfette, ma modificate e ricollazionate sui manoscritti; inaccettabili, perciò riedite ex novo; per gli inediti, prima edizione. Apparato critico e note in sinossi col testo. Indicati i criteri editoriali, i manoscritti della tradizione, le edizioni critiche e le revisioni apportate dal Rialc.
Di fatto, è un modello realistico di come potrebbero evolversi le attuali basi di dati come il BTL, se vi fosse aggiunto l'apparato critico. La presentazione del sito ricorda che "la più parte della lirica catalana è a tradizione unitestimoniale". Nella pagina di presentazione del progetto non si fa cenno della TEI, né dell'XML, quindi si può ritenere che i manoscritti inediti pubblicati qui per la prima volta dobbiamo presumere una semplice trascrizione in HTML. Le pagine HTML del sito sono generate con Microsoft Front Page, per quanto con un codice apparentemente non proprietario.
William of Ockham: Dialogus (online)
Viene riportato, in formato elettronico con markup procedurale (HTML), solo il risultato di una tradizionale edizione critica. Non vengono adottate le raccomandazioni XML TEI per l'Apparatus Criticus. Sono presenti i tradizionali saggi introduttivi.
Aurelii Augustini. Enarratio in psalmus (online)
L'HTML è generato direttamente da Classical Text Editor. La forma è quella di una pagina HTML con frames, e l'apparato nel frame inferiore (separato dal testo). È possibile visualizzare il file cte originale.
Classical text editor è un software WYSIWYG di supporto per preparare un'edizione critica (nella home page si legge: "The word-processor for critical editions, commentaries and electronic publishing"). Il programma è ancora orientato a fungere da supporto per un'edizione critica a stampa. Nel dibattito seguito ad un recente convegno sull'editoria digitale, il programmatore Stefan Hagel ha dovuto di fatto difendersi dall'accusa di non aver ancora fatto il 'salto di qualità' da un'edizione a stampa assistita da software di fotocomposizione, ad una vera edizione digitale, codificata con markup dichiarativo.
La sua 'difesa' è consistita nel ricordare che è possibile un'esportazione del risultato finale (ovvero dell'edizione critica vera e propria) anche in formato elettronico, ovvero in HTML (un esempio è il sito Aurelii Augustini. Enarratio in psalmus) o in XML/TEI.
Un esempio dell'output XML/TEI di CTE è riportato dallo stesso Stefan Hagel, ed è scaricabile dal suo sito. Esaminando una porzione di esso, ci si rende conto di come, nonostante i tag usati siano quelli TEI e la sintassi formale sia quella XML, il markup sia ancora intrinsecamente procedurale - una traduzione in XML di una pagina HTML, concepita per una presentazione su stampa, o al più su una schermata del computer. Ecco, ad esempio, come è resa la nota di apparato
 quoniam in
    <note place="foot" type="a1">
       <p>
          <mentioned>
             <hi rend="i"> <ptr target="w23" /> </hi>
             <hi rend="hide"> # </hi>
          </mentioned>
          speravi in te
          <hi rend="i">tr. <abbr name="sig15">A</abbr></hi>
          <abbr name="sig42"><hi rend="i">w</hi></abbr>
       </p>
     </note>
te <seg id="w23">speravi</seg> 
La nota critico-testuale è resa con l'elemento TEI <note>, ma di fatto è concepita come una semplice nota a pie' di pagina in un word-processor o in una pagina HTML.

B2. Edizioni digitali scientifiche su tradizioni unitestimoniali

The Electronic Beowulf (offline)
Un codice dell’XI secolo gravemente danneggiato (più trascrizioni settecentesche e ottocentesche, che testimoniano uno stato migliore del manoscritto, edizioni, traduzioni, miniature).
William of Palerne. An Electronic Edition (offline)
Basata su un solo manoscritto.
The Augsburg Web Edition of Llull’s Electoral Writing (online)
Sono tre opere, ma ognuna basata su un solo manoscritto. Con immagini e note. Non è specificato il tipo di encoding. Ma il testo è collegato all'immagine.
Zibaldone Laurenziano (online)
Si tratta di un (importantissimo) manoscritto autografo. Il progetto si segnala per la profondità teorica (il responsabile è Raoul Mordenti)
Progetto Pico (online)
Edizione elettronica del Discorso di Pico della Mirandola, frutto della collaborazione di studiosi della Brown University e dell’Università di Bologna. Il lavoro filologico è svolto sull’originale dell’opera, la prima edizione a stampa. La trascrizione in latino, con apparato critico, può essere associata per link all’immagine dell’incunabolo (modello filologico), o in frameset alla traduzione annotata, in italiano o in inglese (testo annotato). La riproduzione facsimilare dell’editio princeps è confrontabile con quelle di altre due edizioni successive (incunaboli) o con il testo pieno (trascrizione). A corredo, bibliografia generale, newsgroup (accesso limitato), biografia di Pico, saggi vari. In HTML.
L'Editio princeps, base della digitalizzazione, non è codificata in XML, ma in HTML.

B3. Ancora edizioni digitali su tradizioni unitestimoniali, ma di molti testi diversi, ovvero archivi di trascrizioni di fonti primarie

ADMYTE: Archivo Digital de Manuscritos y Textos Españoles (offline)
Comprende le trascrizioni e le immagini di manoscritti e incunaboli di testi spagnoli compresi tra il XII e il XVI secolo e un catalogo bibliografico di testi in castigliano, catalano e portoghese. TACT è impiegato per l’analisi linguistica, UNITE per la collazione di testi fino a 30 versioni differenti. Consta di tre edizioni: Admyte 0 del ‘91, I del ‘92, II del ‘99.
Pusceddu lo cataloga nella sezione 'Archivi multimediali', ma è una vera e propria edizione di manoscritti.
Archivio della Tradizione Lirica: da Petrarca a Marino (offline)
Contiene le opere di 81 autori da Petrarca a Marino, comprese le principali raccolte di rime tre-cinquecentesche. Come gli altri CD-ROM di questa collana, uso del sistema di interrogazione testuale DBT di E. Picchi.
Non ho potuto recuperare informazioni tecniche sulla codifica e sulla presenza di immagini. Il progetto sembra analogo al CLPIO (Corpus della Lingua Poetica Italiana delle Origini) di D.S. Avalle, progetto ancora non compiuto.
Codice Diplomatico Digitale della Lombardia Medievale (online)
Work in progress. Intende essere un archivio di trascrizioni in XML/TEI di manoscritti documentari. Intorno alla rivista Scrineum di Pavia sono in corso altri progetti analoghi di diplomatica.
Codices Electronici Ecclesiae Coloniensis (online)
Intende essere un archivio di trascrizioni in XML/TEI di manoscritti documentari. A cura di M. Thaller, è realizzato con Kleio.
Fondi Online (online)
Archivio digitale di manoscritti, stampe, opuscoli e quaderni, compresi tra il ‘700 e il primo ‘900, alla Biblioteca Amanuense.
A cura dell'istituto papirologico "G. Vitelli". Non ho trovato una descrizione del linguaggio di codifica.

B4. Edizioni scientifiche su testimonianze d'autore (anche complesse)

Wittgenstein, Nachlass (offline)
Nachlass è l’opera completa del filosofo tedesco, secondo la catalogazione standard fatta da von Wright nel suo libro Wittgensteins Papers (1982). Sono dati: le riproduzioni fotografiche dei manoscritti e dattiloscritti originali (possono essere zoomate, ruotate o stampate); la trascrizioni diplomatica (con le varianti e gli interventi di mano dell’autore) e normalizzata (con gli emendamenti dell’autore e correzioni di errori minimi); la classificazione dei manoscritti secondo von Wright (da cui si accede a facsimile e trascrizioni). Inoltre è possibile la comparazione tra manoscritti diversi o tra trascrizioni dello stesso manoscritto, e intervenire sui testi conservando i propri file senza però alterare l’originale.
Edizione di notevole complessità, data la presenza di testimoni diversi per uno stesso testo (ad es. diversi manoscritti, o manoscritto vs. dattiloscritto).
Gide, Caves du Vatican (offline)
Prima edizione genetica su CD-ROM. L’insieme dei documenti che costituisce il dossier genetico dell’opera (note, progetti, brogliacci, manoscritti, pre-pubblicazioni con correzioni) è organizzato in un avantesto elettronico, con i facsimile e le trascrizioni diplomatiche di ciascun folio strutturati in ipertesto.
Emily Dickinson, Radical Scatters (offline)
Edizione elettronica di frammenti autografi di Emily Dickinson, con poesie, lettere e altri testi ad essi strettamente correlati. Contiene le riproduzioni facsimilari dei testi, le trascrizioni diplomatiche, i testi marcati SGML, commenti critici, immagini di vari altri documenti.
Edizione molto più 'semplice' metodologicamente, in quanto trascrive semplicemente testimoni unici.
Stijn Streuvels: De teleurgang van den Waterhoek (offline)
Comprende tutti i materiali, manoscritti, a stampa, lettere etc. dell'autore, con immagini e marcatura SGML. Il software di collazione delle varianti sembra ottimo (vd. questa pagina illustrativa).
I Ricordi di Guicciardini (online)
Vd. l'abstract della presentazione del progetto al CLiP 2003 (Firenze).
È basato su XML, in forma di database. Rende conto delle successive stesure dell'autore.
Progetto Maurolico (online)
Archivio dell’opera matematica di Maurolico, a cura di P. D. Napolitani dell’Università di Pisa. Il corpus comprende manoscritti autografi (rimaneggiati a più riprese dall’autore), apografi (con correzioni di mano mauroliciana) ed edizioni a stampa, spesso con errori nelle date apposte dall’autore e numerosi rinvii interni fra opere diverse.
I testimoni sono trascritti in LATEX, o meglio in una sua variante 'personalizzata',il Mauro-TeX. Le trascrizioni tengono conto delle varianti testuali 'in-line', in modo analogo alle raccomandazioni TEI-Critical Apparatus. Ad es:
  simili et similiter \VV{
  {A:posito}
  {S:posita}
  } contento sub datis lineis.
Come risultato, nell'output postscript e in quello HTML, si hanno note di apparato rispettivamente a pie' di pagine e in un frame a parte (vd. la pagina di esempio approntata dai curatori del progetto).
L’Histoire in question (online)
Avantesto ipertestuale di una parte dell’Education Sentimentale di Flaubert, realizzato da T. Williams, University of Hull. Il corpus è strutturato per livelli che rispecchiano i diversi stadi del processo genetico dell'opera.
Lyrical Ballads: an electronic scholarly edition (online)
Realizzata da R. Tetreault e B. Graver ed edita dalla Cambridge University Press, Lyrical Ballads contiene le 4 differenti edizioni a stampa autorizzate dagli autori Wordworth e Coleridge. La riproduzione è dagli originali, sia per i testi, codificati in SGML/TEI (lite version), che per le immagini.
The Melville Electronic Library (online)
Edizione elettronica di opere di Melville in corso allo IATH dell’Università della Virginia. Il Moby Dick, parziale, ha note critiche sensibili e bottoni che aprono immagini testuali e non. Il Typee, testo con varianti d’autore, cancellature e riscritture (edito per foglio 1, recto e verso del cap. 12), può essere fruito invece in 3 modalità: sola trascrizione diplomatica, con note di commento sensibili; versione normalizzata, con note alle revisioni in sequenza (la trascrizione diplomatica delle varianti d’autore quali appaiono nel manoscritto) e alle revisioni narrative (la spiegazione dei cambiamenti successivi operati dell’autore); trascrizione diplomatica con facsimile del manoscritto. Tutti i testi sono codificati in XML/TEI.
Si tratta di un work in progress. La sezione più interessante è il Typee, che però copre una porzione ancora minima del totale. Interessante la tecnica di trasformazione (tramite XSL) usata per rendere graficamente le notazioni XML/TEI.
James Joyce Text Machine (online)
Studio di tecniche ipertestuali (HTML, JavaScript, CSS) nella rappresentazione e annotazione testuale realizzato da H. Ehrlich alla Rutgers University su un brano (Calypso) dell’Ulysses di Joyce.
Interessante esperimento, seppure sostanzialmente basato sull'HTML, e dunque non su markup dichiarativo.
Per la tua Margherita. Lettere di Margherita Datini a Francesco Datini
Versione elettronica del corpus di lettere inviate da Margherita Datini al marito, realizzata all’Archivio di Stato di Firenze che custodisce il Fondo Datini. I testi, in XML, sono dati in immagine e trascrizione (visualizzabili singolarmente o in sinossi), e accompagnati da schede archivistiche e traduzioni in italiano corrente e inglese.
The Walt Whitman Archive (online)
L’archivio delle opere di Whitman, ancora a cura dello IATH, comprende: le edizioni a stampa, in prosa o in versi, in formato solo testo, codificate SGML/TEI; i manoscritti originali, con trascrizione diplomatica in SGML e immagine ingrandibile
The Rossetti Archive (online)
Archivio della produzione pittorico-letteraria di Dante Gabriel Rossetti [...]. Tutti i testi originali, le note e i commenti editoriali (di carattere storico, letterario e critico) sono codificati in SGML. Abbinamento testo e immagine facsimilare dei vari manoscritti o delle edizioni a stampa, oltre che testo e dipinto.
The William Blake Archive (online)
Archivio delle opere del pittore e poeta William Blake [...]. Codifica in SGML per tutti i documenti primari, i commenti editoriali, le descrizioni delle immagini.
Digital Variants (Domenico Fiormonte; online)
Vd. l'abstract della presentazione del progetto al CLiP 2003 (Firenze), e la home page stessa del sito.
Propone strumenti per confrontare (in collegamento con le immagini degli autografi) versioni diverse di un'opera da parte dell'autore, all'interno del processo genetico dell'opera stessa, rappresentando il fenomeno complesso della varianza testuale d'autore. Si tratta esclusivamente di autori contemporanei.

B5. Edizioni scientifiche digitali su tradizioni pluritestimoniali

Charrette project (online, previa registrazione aperta a tutti)
Edizione critica elettronica de Le Chevalier de la Charrette (Lancelot) realizzata all’Università di Princeton, sotto forma di database. Per ognuno degli 8 manoscritti della tradizione è data la trascrizione diplomatica in SGML/TEI (arricchita da markup grammaticale e retorico), collegata all’immagine a colori a tutto schermo. Da ciascuna delle trascrizioni si può accedere alle altre selezionando la sigla del manoscritto. Inoltre, le edizioni critiche, con testo in francese antico e moderno, di Foulet-Uitti[34], tavola delle lezioni rifiutate e un programma di ricerca lessicale basato su categorie semantiche. Tabella che spiega lo schema di codifica adottato.
Trascrizioni XML/TEI ed immagini dei manocritto, il tutto collegato con un database. Testo 'fluido'. La riproduzione dell'edizione critica a stampa di Uitti è presentata accanto ai testi dei manoscritti, come fosse uno dei dei testimoni (con la sigla U).
Il CLPIO: Corpus della Lingua Poetica Italiana delle Origini
Un corpus lemmatizzato basato sui manoscritti
Fondatore: D.S. Avalle; coordinatore: Lino Leonardi. Sito internet. Ragguagli del 2000 del prof. Leonardi sul progetto.
Dapprima sono stati descritti tutti i manoscritti, anche se non su base TEI; l'articolo di Leonardi non indica che tipo di markup è stato usato, ma accenna al fatto che il progetto si è svolto per decenni, mentre il software e gli standards informatici andavano cambiando in continuazione, quindi si può dedurre che il loro markup sia indipendente dalla TEI, e forse anche dall'SGML. Così scrive Leonardi:
Avalle optò infatti, nello stabilire il testo, per una scelta assolutamente radicale; non c’è bisogno che mi soffermi sulla decisione di fornire tanti testi quanti sono i manoscritti, purché databili entro il Duecento, e di rispettare rigorosamente non solo la lezione, ad oltranza, ma anche la forma grafica di ciascun testimone, anche in caso di tradizione pluritestimoniale (unico caso recente paragonabile, in ambito romanzo, è il Nouveau recueil complet des fabliaux W. Noomen e N. Van den Boogaard).
E più avanti, ancora, sulla rinuncia a ricostruire il testo delle singole liriche:
Sul piano strettamente ecdotico, non si è nemmeno pensato di poter qui sovrapporre un testo ricostruito, che fungesse da ‘macrolemma testuale’ rispetto al livello delle forme testuali date dalle diverse testimonianze manoscritte (come invece avviene nel citato Nouveau recueil complet des fabliaux).
Come unico altro progetto di questo grado di complessità, rimanda al Nouveau recueil complet des fabliaux.
Decameron ipertestuale (offline)
Comparazioni tra testo critico (edizione Branca), manoscritti (tra cui l’autografo Hamilton) e stampe cinquecentesche.
Alla base c'è, appunto, un testo critico a stampa preesistente, digitalizzato.
The Piers Plowman Electronic Archive (offline)
L’archivio consta di: trascrizioni e immagini di tutti i 54 manoscritti della complessa tradizione del Piers Plowman; i tre archetipi (l’autore aveva scritto 3 versioni dell’opera, ma non si ha nessun autografo); i tre relativi testi critici con annotazioni. Le immagini a colori sono riprodotte dagli originali e le trascrizioni sono codificate in SGML, (ma disponibile anche una versione HTML). TACT e Collate per concordanze e collazione.
The Wife of Bath’s Prologue (offline)
Del poema di Chaucer, parte dei Canterbury Tales, sono date: le immagini e le trascrizioni di tutti i 54 manoscritti e delle 4 edizioni a stampa che costituiscono la tradizione, codificate in SGML; le descrizioni dei testimoni e le trascrizioni delle glosse; la possibilità di collazionare parola per parola e di visualizzare porzioni (righe o parole) nel manoscritto. La pubblicazione è la prima tappa di un ampio progetto che prevede la digitalizzazione di tutti i Canterbury Tales (Canterbury Tales Project: http://www.cta.dmu.ac.uk/projects/ctp/index.html).
La famiglia dell'antiquario di Goldoni (offline)
Edizione ipertestuale che contiene e confronta le tre differenti versioni della commedia attestate nelle edizioni Bettinelli, Paperini e Pasquali. È uno dei primi studi di filologia elettronica per CD-ROM compiuti in Italia.
Le tre edizioni in questione non sono a loro volta edizioni critiche, ma possono essere considerate semplici testimoni del testo.
Editions and Adaptations of Shakespeare (Offline)
Comprende le 11 maggiori edizioni dell’opera completa di Shakespeare pubblicate fino all’Ottocento, 24 edizioni di opere singole contemporanee all’autore, alcuni apocrifi e testi correlati, e un centinaio di adattamenti teatrali ad opera di autori diversi per un arco di tre secoli. I testi, codificati in SGML, sono visualizzabili simultanemente in versioni diverse e interrogabili.
Si tratta sostanzialmente di un archivio testuale. Bisognerebbe poterlo visionare, per vedere se è un'edizione nel senso indicato da Buzzati (cioé se prevede forme di collazione). Ma dalla descrizione, sembre che l'opera vada comunque verso la 'testualità aperta'.
The Planctus for William Longsword (online)
Edizione elettronica di un componimento normanno dell’XI secolo, a cura di R. Helmerichs, University of Kansas. Per ciascun verso del Planctus sono dati, in una stessa pagina statica, la corrispondente porzione di immagine per ciascuno dei due manoscritti che lo trasmettono, le trascrizioni, il testo critico di ciascuna delle tre principali edizioni esistenti[...]
I manoscritti sono solo due, e l'aspetto 'critico' è dato dalla riproduzione di edizioni critiche esistenti. È presente il collegamento testo-immagine.
Corpus dei Manoscritti Copti Letterari (online, con password)
Edizione elettronica della Historia Ecclesiastica coptica (pervenuta in 3 manoscritti frammentari) curata da T. Orlandi, Direttore del CISADU della Sapienza di Roma. Comprende le immagini dei manoscritti con trascrizione diplomatica affiancata; il testo diviso in paragrafi con collegamenti alla traduzione, in italiano o in inglese, e ai frammenti con trascrizione; commento critico-letterario, paleografico e filologico.
Uno dei progetti più 'pensati' teoricamente. Già i problemi dell'alfabeto copto imponevano un maggior grado di riflessione.
L’Ospital d’Amours by Achille Caulier (online)
Per ognuno dei 20 manoscritti che trasmettono il testo provenzale è data sigla, locazione, descrizione e numero delle righe di versi. Dalla sigla si accede alla trascrizione, che può essere collazionata con le altre per stanza o per verso, selezionando il numero corrispondente (l’opzione sarebbe disponibile anche dall’home page, ma non risulta attiva). Per alcuni manoscritti (per esempio Pa) è disponibile anche l’immagine totale del folio, ingrandibile, o quella parziale del verso, evidenziato in bianco su grigio.
Parzival (online)
Trascrizione di tutti i manoscritti, immagini (collegate). Un manifesto del testo 'aperto' (non è proposto un testo dell'editore). Lo stemma codicum è ricostruito tramite Collate.
Vindolanda Tablets Online (online, appunto)
Edizione elettronica del corpus di epigrafi lignee di Vindolanda (Inghilterra), realizzata all’Università di Oxford e basata sull’edizione cartacea Vindolanda Writing Tablets (voll. I e II) di A. Bowman e D. Thomas. Si articola in 4 sezioni: Tablets è un database che riproduce tutte le tavolette in immagine (con raffinato zooming viewer), e trascrizione in latino, traduzione in inglese, commento, note; tutti i testi sono in XML/TEI, con alcune modifiche alla DTD per epigrafi (EpiDoc).
Un progetto epigrafico, basato su standard EpiDoc.
CETE (online)
Centro di edizioni elettroniche all’Università di Nantes, con testi del medioevo e del ‘600. Consente la comparazione di due testi per volta, in combinazioni da scegliere attraverso i vari menù a cascata. Sono disponibili: tutte le trascrizioni degli 8 manoscritti del Lancelot di Chrétien de Troyes; l’originale, la trascrizione e l’edizione critica del Ms BN Fr. 19152; il facsimile dell’edizione originale e la trascrizione annotata dei Discours di Palissy; due edizioni del Code Noir; saggi e riviste.

C. Nuove forme di testualità

C1. Archivi collaborativi

Manuscript fragments bound in books (online)
Collezione di manoscritti in latino castigliani e inglesi e di frammenti in pergamena o su carta al sito Bibliographics. [...] Uno dei frame è apposito per trascrivere, tradurre o commentare il testo e inviare la propria proposta.
The Vergil Project (online)
Progetto su Virgilio realizzato da studenti e insegnanti all’Università della Pennsylvania. [...] [È presente] uno spazio di lavoro che permette, previa iscrizione, di inviare e modificare continuamente le analisi, grammaticali o sintattiche, le traduzioni, i commenti già inviati.
La collaborazione della community sembra richiesta più a fini didattici che scientifici.
An Interactive Finnegans Wake Notebook Page (online)
Il curatore ignoto di questa pagina (amatore o studioso) richiede esplicitamente la collaborazione di una world community per decifrare e interpretare una pagina dei quaderni usati da Joyce nella composizione del Finnengans Wake, con molte cancellature e riscritture
Ivanhoe. A game of textual manipulation (online)
Gioco interattivo ideato da J. McGann. Per iniziare bisogna assumere una precisa identità e un alias con cui presentarsi, definire la propria reale identità (che viene svelata solo quando si esce dal gioco) e le caratteristiche del ruolo che si assume. Si può creare un nuovo gioco, scegliendo tra 4 testi base (Ivanhoe, Tristham Shandy, Neuromancer, A rose for Emily), invitando altri giocatori a giocare o osservare, o entrare in uno dei giochi in corso. Lo scopo è intervenire sul testo dato con inserzioni proprie in un qualunque punto. Le aggiunte possono essere lineari (indistinguibili o riconoscibili per colore diverso) o ipertestuali (il nome dell’aggiunta è un link nel corpo del testo). Si possono anche stabilire relazioni tra due o più unità testuali attraverso icone.
Geniale nell'impostazione, indica una concezione della testualità estremamente 'aperta': il testo 'classico' può essere manipolato dai moderni, all'interno di un 'gioco di ruolo testuale'.
Medieval Palaeography (online)
Corso di paleografia e diplomatica all’Università di Leicester, articolato in numerose sezioni, tra le quali introduzioni generali sulle discipline, manuali, schede, questionari interattivi, bibliografia, glossario, immagini, note grammaticali, confronto in parallelo di testi. Sono anche disponibili un form in cui inserire le proprie proposte di traduzione e commento e uno per suggerimenti relativi al sito.
L'aspetto collaborativo sta nel form citato sopra. Ma naturalmente l'impostazione principale è didattica.
MASTER Manuscript Access through Standards for Electronic Records (online)
Progetto finanziato dall’Unione Europea e promosso da P. Robinson. L’obiettivo è creare un catalogo online dei manoscritti medievali raccolti nelle diverse biblioteche europee, codificati secondo gli standard internazionali SGML/XML della TEI, che è tra i partner del progetto. MASTER mette a disposizione sul sito Internet la documentazione sugli standard (interna al progetto e ufficiale) e i software sviluppati per la codifica dei manoscritti (NoteTab, text-editor SGML/XML per Windows, download gratuito; parser SGML/XML e viewer XML online; database MA i cui dati possono essere esportati in SGML/XML). Si può inoltre accedere al prototipo di catalogo online che si trova nelle università di Leicester e Oxford per consultare le descrizioni di manoscritti già disponibili o inserirne di nuove.
MALVINE Manuscripts And Letters Via Integrated Networks in Europe (online)
Il progetto mira a collegare in rete quelle istituzioni europee che conservino manoscritti moderni e lettere (biblioteche, archivi, centri, musei) per formare un unico database di risorse accessibile a chiunque sul Web. Interfaccia multilingue e sviluppo del multi-site search engine MALVINE, che consente la condivisione dell’informazione indipendentemente dalle diverse soluzioni tecniche o applicazioni Web adottate dalle singole istituzioni che vogliano collegarsi.
Hypernietzsche (online)
Progetto cooordinato da P. D’Iorio dell’ITEM – CNRS. L’obiettivo è “creare un’infrastruttura di lavoro collettivo in rete”, inizialmente incentrata su Nietzsche, poi allargata alle scienze umane in genere. L’informazione dell’ipertesto è strutturata in Materiali (opere, lettere, manoscritti, libri annotati, documenti biografici del filosofo), Contributi (trascrizioni, edizioni, percorsi secondo linee cronologiche, tematiche e genetiche, commenti brevi di varia natura, saggi, bibliografia), Autori (curriculum scientifico ed elenco pubblicazioni. Per una presentazione completa del progetto vedi D’Iorio 2000. Il volume è disponibile anche online.

C2. I testi visuali

TextArc (online)
Rappresentazione testuale visiva in Java, ideata da W. Bradford Paley della Digital Image Design Incorporated. Il testo scelto (Amleto, Alice e molti altri messi a disposizione dal Project Gutenberg) è racchiuso in un ovale, che ha linee ai bordi, e parole all’interno. Una parola più frequente è più luminosa; raggi in oro la collegano a tutte le parti del testo in cui appare, che scorrono lungo le linee dei bordi (considerando l’inizio alle 12 e procedendo in senso orario). Linee curve uniscono nell’ovale tutte le occorrenze di un dato termine. Si può anche scegliere l’opzione show text per aprire una finestra in modalità di lettura lineare, o concordance per avere il numero di occorrenze di ogni parola.
Visual Thesaurus (online)
Thesaurus della lingua inglese. Le parole appaiono nello spazio, collegate per senso da raggi; quella che viene selezionata, diventa la base rispetto alla quale sono dati i sinonimi, e si sposta al centro. Si può interrogare per quattro categorie grammaticali (nomi, verbi, avverbi, aggettivi), modificare il modo in cui appaiono le parole (quantità dei dati, dimensioni del grafo, dimensioni dei caratteri), cambiare lo spazio (2D o 3D).

Paolo Monella, Università di Palermo

Edizioni digitali su testi dell'antichità classica

I progetti che non ci sono

Tra i progetti di edizioni digitali scientifiche fin qui esaminati (la categoria B della lista), nessuno riguarda direttamente i testi dell'antichità greco-latina, eccetto The Vergil Project, di cui pure abbiamo evidenziato il valore più didattico che scientifico. Potremmo ancora menzionare il Corpus dei Manoscritti Copti Letterari, e i progetti The Confessions of Augustine: An Electronic Edition e Aurelii Augustini. Enarratio in psalmus. Ma è significativo come, per trovare dei veri progetti di filologia digitale (tra i quali peraltro spicca per novità di impostazione solo il progetto di T. Orlandi sui manoscritti copti), si debba uscire dall'ambito della tradizionale periodizzazione della letteratura classica, e, nel caso del progetto sui testi copti, addirittura dall'ambito delle lingue classiche.

Nella sua rassegna di progetti di editoria digitale, Patrick Sahle fa menzione dell'attività editoriale dell'editore Brepols (l'editore, tra l'altro, di BTL e CLCLT). Ma (significativamente?) non menziona le pubblicazioni di interesse classicistico tra le principali realizzazione della casa editrice, e sulle scelte tecnico-metodologiche di codifica del testo di quest'ultima esprime un giudizio forse senza infamia, ma sicuramente senza lode (enfasi mia):

Der Belgische Verlag Brepols vetreibt eine ganze Reihe großer Text- und Quellensammlungen, die im allgemeinen unter einem Plain-Text/Datenbank-Paradigma organisiert sind und zu denen ich wegen der restriktiven Preispolitik keine allzu fundierte Kritik abgeben kann. Die etwas sonderbare Verlagspolitik, die man auch als fehlendes Interesse an grundsätzlichen und konzeptionellen Fragen digitaler Publikationen beschreiben könnte, zeigt sich auch darin, daß noch im Dezember 1999 auf einer Seite vom Mai 1998 die zukünftigen Ausgaben des Jahres 1997 angekündigt werden! Als Sammlungen von Editionstexten im weitesten Sinne sind aufzufassen: Monumenta Germaniae Historica (eMGH), The Papal Letters, The Archive of Celtic-Latin Literature (ACLL) und der Thesaurus Diplomaticus.

Oltre a questa 'non-citazione' dei Cd-Rom, per noi classicisti così importanti, della Brepols, non si trova nella pur ricca rassegna del dott. Sahle alcuna altra notizia di progetti riguardanti la letteratura greco-latina, eccettuato il nostro S. Agostino, che, dopo aver tenuto a battesimo (con gli studi di Padre Roberto Busa) l'era dell'informatica umanistica, fa la sua comparsa anche qui in virtù del Corpus Augustinianum Gissense su Cd-Rom.

I testi classici sono assenti anche dal progetto Signum di editoria elettronica in XML della Scuola Normale Superiore di Pisa, per quanto al progetto lavorino anche studiosi di profilo classicistico come Marzia Bonfanti. Nel recente convegno "XML per i Beni Culturali" (Pisa, 25 marzo 2004), i cui atti sono in uscita, non si trovano relazioni su progetti legati alle letterature classiche.

A1. Edizioni non scientifiche e archivi testuali, basati sulla digitalizzazione di edizioni cartacee, con apparato multimediale (immagini ed altro)

The Latin Library (online)
Un ampio archivio di testi latini in formato HTML. Gli esempi di questo tipo di archivi per il mondo classico potrebbero moltiplicarsi.
The Internet Classics Archive - MIT (online)
Attualmente 'terremotato' da una recente perdita di dati sul server. Per i testi, si appoggia notevolmente al Perseus Project. Quelli che riporta, non sono editi criticamente.
Offre però la possibilità di aggiungere (come in un forum) post di commento ai testi.

B3. Ancora edizioni digitali su tradizioni unitestimoniali, ma di molti testi diversi, ovvero archivi di trascrizioni di fonti primarie

Papirologia

Papyrology at Oxford (online)
Ospita dei database di immagini di papiri dai siti di Ossirinco e di Ercolano.
Duke Databank of Documentary Papyri (online)
Prima disponibile in Cd-Rom, ora ne è presente una versione più aggiornata online (all'interno del sito del Perseus Project)
PSI online
Il progetto è in corso: vd. una recente presentazione del progetto: "Scopo dell’iniziativa è la realizzazione di una sorta di ‘ricostruzione virtuale’, fruibile via internet, della collezione di papiri (più di 1500 reperti) messa insieme, attraverso decenni di scavi archeologici e missioni in Egitto, dalla “Società italiana per la ricerca dei papiri greci e latini in Egitto” (poi divenuta l’Istituto Papirologico Vitelli)".
Gestione informatizzata di archivi di papiri medici greci e di varie edizioni a stampa del testo del Contradicentium medicorum di Gerolamo Cardano (notizia del progetto di ricerca)
Andrea Bozzi, presso l'ILC (Istituto di Linguistica Computazionale) del CNR di Pisa, applica la filologia digitale (incluso il trattamento di immagini), ma ancora una volta, almeno per quanto riguarda i papiri, a testimoni unici.

Epigrafia

EpiDoc: Epigraphic Documents in TEI XML (online)
L'obiettivo di EpiDoc è stabilire standard XML/TEI per la creazione di databases di iscrizioni. I progetti in corso sono: Aphrodisias in Late Antiquity (ALA2004); Inscriptions of Aphrodisias (InsAph); U.S. Epigraphy Project (USEP); Vindolanda Tablets Online.

I progetti di epigrafia digitale, non basati su standard XML/TEI, sono molti. Per orientarsi, molto utile la raccolta di links di ASGLE. Tra i maggiori possiamo ricordare i seguenti: Epigraphische Datenbank Heidelberg (EDH); Epigraphische Datenbank Heidelberg (EDH); Electronic Archive of Greek and Latin Epigraphy (EAGLE) - Epigraphic Database Roma; Searchable Greek Inscriptions - The Packard Humanities Institute.

B. Edizioni scientifiche digitali

Center for Hellenic Studies, Harvard: Classics@, Issue 2 (online)
Il secondo numero della rivista online ddel CHS di Harvard, che apparirà online all'inizio di giugno 2006, presenterà i risultati di un workshop (tenutosi a giugno 2003) in cui si sono discussi dei progetti di applicazione delle tecnologie informatiche (legate ad Internet, ma in qualche caso forse anche nella direzione della filologia digitale) a testi classici, tra cui Omero. In realtà, le notizie riportate attualmente sul sito sul workshop e sui progetti da avviare non lasciano comprendere l'esatta natura dei progetti stessi.
Homer and the Papyri (online)
Il progetto del Center for Hellenic Studies di Harvard si pone in realtà a metà strada tra la categoria B3/Papirologia, descritta sopra, e la presente. Si tratta di un database delle sole lezioni varianti al testo dei poemi omerici che si ritrovano in papiri. Di fatto, non è presente alcuna edizione del testo, però è possibile, per ogni passo dei due poemi, conoscere le varianti rintracciabili in un vasto numero di papiri, il che può essere considerato in qualche modo una diversa forma di apparato critico.
Il commento di Galeno al ΠΕΡΙ ΑΡΘΡΩΝ di Ippocrate (online)
All'interno del sito del Corpus Medicorum Graecorum-Latinorum Project, Christian Brockmann ha pubblicato questa vera e propria edizione critica digitale, di cui non è dichiarato (almeno nella presentazione contenuta sul sito) il linguaggio di codifica, ma che presenta un apparato critico interattivo e la possibilità di visualizzare le riproduzioni dei manoscritti.

Filologia biblica

Digital Nestle-Aland Prototype e New Testament Transcripts Prototype (entrambi online: vd. Nestle-Aland e New Testament Transcripts)
Nel campo della filologia biblica i progetti più importanti sono i due legati all'Università di Münster. Il Digital Nestle-Aland Prototype presenta il testo dell'edizione critica cartacea Nestle-Aland di due soli libri del Nuovo Testamento (la prima e la seconda lettera di Giovanni, ma costituisce una vera e propria edizione critica digitale: l'apparato critico interattivo non è solo una digitalizzazione di quello cartaceo, bensì è basato su nuove trascrizioni digitali di 24 manoscritti. Queste ultime sono visualizzabili in modo indipendente. La possibilità di visualizzare la varianza testuale in molti modi (confrontando due testi, con apparato critico parola-per-parola, verso-per-verso, visualizzando il testo di uno dei 24 testimoni etc.) lascia supporre una codifica dichiarativa e non procedurale delle varianti.
Mentre il prototipo della versione digitale del Nestle-Aland riporta tutti i 24 manoscritti (dunque un apparato critico completo), ma per soli due libri (Giovanni 1 e 2), l'altro progetto portato avanti dalla stessa Università di Münster, il New Testament Transcripts Project, presenta un'edizione critica digitale di tutti i libri del Nuovo Testamento basata sugli stessi principi (e dotata della stessa interfaccia utente), ma, costituendo un work in progress, non presenta per tutti i libri tutti i testimoni, ma un numero di manoscritti variabile tra 2 e 26.
The Online Critical Pseudepigrapha project (online)
Un'edizione digitale di testi pseudoepigrafi del Vecchio Testamento. Alcune di tali edizioni sono dotate di apparato critico. In questi casi, il testo critico è codificato secondo un markup dichiarativo (XML) simile, ma non coincidente, con le specifiche TEI per il Critical Apparatus. I testi critici sono: Enoch (editore: Ken Penner); Testamento di Adamo (editore: Ken Penner); Testament of Job (editori: Ian Scott, con Ken Penner e David Miller).

L'orgoglio dei classicisti: le banche dati testuali

TLG - Thesaurus Linguae Graecae (online)
Testi greci letterari, fino all'età bizantina ed oltre. Dapprima in Cd-Rom, adesso online (su abbonamento). In beta code. Senza apparato critico.
PHI 5 - Packard Humanities Institute
Testi latini fino al 200 d.C. e varie versioni della Bibbia. In Cd-Rom, non più aggiornato da anni (così come il loro sito internet). Anch'esso in beta code, e senza apparato critico.
BTL - Bibliotheca Teubneriana Latina e CLCLT - ora Library of Latin Texts
Così il sito di Burioni, il distributore del CD per l'Italia, presentava il BTL:
Edizione in formato elettronico della Bibliotheca Scriptorum Romanorum Teubneriana: la base dati presenta il testo completo (ma privo della prefazione e dell'apparato critico) delle edizioni standard (editiones maiores) di circa 900 opere di 460 autori classici latini, scritte nell'arco di otto secoli, dal 300 a.C. al 500 d.C., da Plauto a Marziano Cappella, più una selezione di opere in latino medievale e moderno.
Lo stesso editore, Brepols, e lo stesso gruppo editoriale (il CETEDOC) hanno pubblicato, con gli stessi criteri di codifica testuale, varie versioni del CLCLT (Cetedoc Library of Christian Latin Texts). Dalla versione 5 in poi, quest'ultimo ha inglobato i testi latini di età classica del BTL, prendendo il nome di Library of Latin Texts.
Dalla presentazione della Library of Latin Texts sul sito dell'editore Brepols (enfasi mia):
"The database comprises almost all works published in the Corpus Christianorum, both Series Latina and Continuatio Mediaeualis, the literature from Antiquity Bibliotheca scriptorum Romanorum Teubneriana and 600,000 words for the modern period. An important number of works have been taken from other collections such as the Corpus Scriptorum Ecclesiasticorum Latinorum, Sources Chrétiennes, Migne’s Patrologia, Acta Sanctorum, Analecta Hymnica Medii Aevi.
CLCLT is the world's leading database for Latin texts. It contains texts from the beginning of Latin literature (Livius Andronicus, 240 BC) through to the texts of the Second Vatican Council (1962-1965). It covers all the works from the classical period, the most important patristic works, a very extensive corpus of Medieval Latin literature as well as works of recentior latinitas. The complete works of writers such as Cicero, Virgil, Augustine, Jerome, Gregory the Great, Anselm of Canterbury, Bernard of Clairvaux and Thomas à Kempis can thus be consulted. The texts have been taken from the Corpus Christianorum series and from many other leading editions".
A fronte di questa impressionante ampiezza di copertura (qualità che il progetto condivide con il TLG online), l'unica marcatura del testo a me nota è quella relativa a titoli, numeri di paragrafo ed altre stringhe che non siano riconducibili al testo antico, che vengono così escluse dalle ricerche testuali. Si noti, per contrasto, che questa distinzione non è stata fatta al momento della digitalizzazione dei testi del TLG e del PHI5.
Intratext (online)
I testi sono codificati attraverso un linguaggio di marcatura specifico (non-SGML) elaborato dalla società Èulogos, che gestisce il progetto Intratext: l'ETML (Èulogos Text Markup Language), che permette l'ipertestualizzazione lessicale. Gli standard del progetto sono descritti in un articolo disponibile online di N. Mastidoro. È presente una notevole attenzione all'accuratezza tipografica, e l'intero archivio è concepito in modo da realizzare concordanze automatiche, ma il formato è proprietario e le edizioni non sono critiche.
Perseus Digital Library (online)
Il progetto relativo alla codifica di testi dell'antichità classica più avanzato dal punto di vista delle metodologie di edizione testuale digitale. Codifica tutti i testi in formato XML, e la grande maggioranza di essi secondo la DTD TEI, eventualmente adattata ad esigenze specifiche. In questa pagina è possibile trovare una rassegna di articoli (con abstract e links all'articolo full-text) sul progetto e i suoi standard. La flessibile base XML permette lo sviluppo di una complessa rete ipertestuale che connette i testi tra loro, e a strumenti secondari come dizionari, commenti, tools di analisi morfologica, di analisi delle frequenze lessicale etc.
Va anche detto che i testi sono comunque basati sulla digitalizzazione di edizioni a stampa, e non costituiscono dunque edizioni scientifiche digitali.

Licenza Creative Commons
Quest'opera è distribuita con Licenza Creative Commons Attribuzione - Condividi allo stesso modo 4.0 Internazionale.