Paolo Monella, Università di Palermo

Edizioni critiche digitali,
XML e letterature classiche

L'edizione scientifica digitale

Cinzia Pusceddu al CLiP 2001: una storia della filologia elettronica

Vedi l'abstract dell'intervento di Cinzia Pusceddu a Computers, Literature, Philology, Seminario Internazionale (6-9 dicembre 2001, Gerhard-Mercator-Universität Duisburg).

0. Edizioni non scientifiche (codifiche procedurali)

Archivi scaricabili in formato TeX (vd. ad es.: A free Beta-compatible textbase with software)
Archivi in HTML (infiniti esempi, tra cui la già citata The Latin Library).

1. Modi diversi dall'XML/TEI di codificare in modo digitale la varianza testuale (soprattutto tramite codifiche procedurali)

Si tratta dei progetti che compongono la sezione "B1" della rassegna qui di seguto ovvero Edizioni scientifiche condotte con metodologia tradizionale, i cui soli risultati sono presentati in formato digitale.

2. La codifica XML/TEI - modulo Critical Apparatus

Vd. la sezione relativa (cap. 19) delle Guidelines P5.

Il livello di presentazione della varianza testuale arriva fino alla lezione ("reading"), ovvero parola normalizzata.

La "lezione" è rappresentabile attraverso una sequenza di caratteri ASCII, incluse eventualmente entità che rappresentino glifi, quali &a-; per una 'a' sormontata da un trattino, usata in sistemi scrittori di ambito germanico medievale. A questo livello di formalizzazione, però, potremo dire più precisamente che tali entità non rappresentano glifi (ovvero 'tokens', contingenti realizzazioni grafiche di un grafema), ma grafemi ('types).

Tramite software apposito, è possibile rendere conto al fruitore dell'edizione critica digitale delle operazioni ermeneutiche dell'editore da questo livello (le "lezioni" attestate nella tradizione) fino al testo da lui (eventualmente) proposto.

Ecco un esempio di questo tipo di markup:

 <app>
  <rdg wit="#El">Experience though noon Auctoritee</rdg>
  <rdg wit="#La">Experiment thogh noon Auctoritee</rdg>
  <rdg wit="#Ra2">Eryment though none auctorite</rdg>
 </app>

3. La codifica XML/TEI - modulo Transcription of Primary Sources

Anche qui vd. la sezione relativa (cap. 19) delle Guidelines P5.

Il lavoro sui due moduli (Critical Apparatus e Transcription of Primary Sources) è stato svolto da due commissioni separate: Peter Robinson ha presieduto quella relativa al Textual Criticism (d'ora in poi, per brevità, TEI/Apparatus), Claus Huitfeld quella relativa alla Trasncription of Primary Sources (d'ora in poi TEI/Transcription). In seguito, però, il lavoro delle due commissioni ha proceduto in modo sempre più collaborativo, fino a che i due responsabili non hanno preso a collaborare personalmente alla messa a punto finale di entrambe le sezioni. Di queste fasi dà nota lo stesso Peter Robinson in: Robin C. Cover, Peter M. W. Robinson, Encoding textual criticism, "Computers and the Humanities", Volume 29, Issue 2, Mar 1995, Pages 123 - 136.

Se si sceglie di trascrivere (e descrivere) i singoli testimoni, facendo di fatto un'edizione diplomatica elettronica di ciascuno, usando i marcatori del modulo TEI/Transcription, il livello di presentazione della varianza testuale si spinge fino al livello dei glifi e della loro organizzazione nello spazio fisico del manoscritto, ovvero al livello dellarealizzazione grafica della scrittura sul supporto fisico del testimone.

Sempre per mezzo di un software di interfaccia, al fruitore dell'edizione critica digitale è possibile rendere conto di fenomeni grafici come abbreviazioni, lettere poco leggibili, cambiamenti di mano, inserzione di porzioni di testo in margine, tra le righe, cancellature e correzioni, dando conto della varianza testuale anche a questo livello.

Ad esempio, se due manoscritti presentassero entrambi la lezione 'pervicax' ma l'uno (A) abbreviando 'per' (ad esempio col glifo spesso rappresentato in ambito TEI con &p-underbar; ovvero una 'p' con l'asta inferiore tagliata da una lineetta trasversale), l'altro (B) non abbreviando, tale livello di varianza testuale sarebbe codificabile. La trascrizione di questo passaggio in A sarebbe infatti:

<abbr expan="per" cert="0.6" resp="PM">&p-underbar;</abbr>vicax

Mentre la trascrizione della porzione corrispondente di B sarebbe semplicemente:

pervicax

Nell'esempio precedente, abbiamo codificata altra informazione importante: tramite l'uso degli attributi cert e resp abbiamo indicato che, possibilmente per motivi di scarsa chiarezza della scrittura del manoscritto A o di un danneggiamento del supporto in quel punto, il responsabile della trascrizione del manoscritto A (PM, Paolo Monella) è sicuro solo al 60% dello scioglimento dell'abbreviazione. Si tratta di informazioni che possono risultare importanti per l'editore e per il fruitore dell'edizione critica, al momento della valutazione comparativa delle varianti testuali.

Problemi teorici nella mescolanza tra i due set di marcatori

I due set di marcatori (TEI/Apparatus e TEI/Trascription) possono essere usati nello stesso documento. Ad esempio, in un file XML/TEI contenente un'edizione critica, è possibile, in casi di lettura particolarmente problematica del manoscritto, annidare nell'elemento <rdg> un 'pezzo di trascrizione di un manoscritto', realizzato con tags presi da TEI/Transcription. Nell'esempio seguente indichiamo, nel file XML di un'edizione critica, che il testimone A legge 'p(er)vicax', con abbreviazione iniziale, il testimone B 'pervicax' senza abbreviazione:


vere
  <app>
    <rdg wit="A">
      <abbr expan="per" cert="0.6" resp="PM">&p-underbar;</abbr>vicax
    </rdg>
    <rdg wit="B">
      pervicax
    </rdg>
  </app>
sum

A livello di riflessione teorica, in realtà, tale commistione apre delle smagliature nel modello di rappresentazione testuale della varianza testuale della TEI: l'oggetto della rappresentazione non è più la "lezione" (intesa come parola graficamente normalizzata), ma la realizzazione grafica di tale parola sulla pagina del manoscritto, anzi più ancora in profondità l'aspetto fisico del testimone (si pensi all'esempio di una parola aggiunta a margine: non stiamo descrivendo solo i glifi di cui è composta, ma la posizione all'interno dello spazio fisico della pagina). Ma, come più volte segnalato da studiosi europei, ad esempio da Tito Orlandi anche di recente, il team della TEI sembra mancare di una profonda attenzione agli aspetti teorico/metodologici della codifica testuale digitale.

Ancora maggiore è la confusione teorica quando elementi di TEI/Apparatus vengono inseriti all'interno di files XML contenenti trascrizioni di manoscritti. In questo caso, il tag <rdg> indica non una "lezione" presa da un testimone A (<rdg wit="A">), ma, all'interno del manoscritto che si sta trascrivendo, una possibile "lettura" (interpretazione) da parte del trascrittore di un segno grafico poco chiaro (<rdg resp="PM" cert="0,8">). Anche il seguente esempio, come i precedenti, è preso dalla versione P5 delle TEI Guidelines, e va immaginato come un frammento di un file XML contenente la trascrizione di un manoscritto:

Virginite is grete

<app>
  <rdg resp="#ES">perfecti<abbr>oi</abbr>
  </rdg>

  <rdg xml:id="f105" resp="#FJF">perfectio<expan>u</expan>n</rdg>
  <rdg xml:id="r105" resp="#PGR">perfectiou<expan>n</expan>

  </rdg>
 </app>
<!-- ... <note> appearing elsewhere in the document ... -->

 <note target="#r105 #f105">Furnivall's expansion implies that the bar
   is an abbreviation for 'u'. There are no certain instances of
   this mark as an abbreviation for 'u' in these MSS and it is
   widely used as an abbreviation for 'n'. Ruggiers' expansion is to
   be accepted.</note>

Trascrizione dei testimoni ed immagini digitali

Per il momento, possiamo mettere anche noi tra parentesi i nodi non risolti a livello teorico, soprattutto per il primo caso (elementi di trascrizione contenuti in elementi <rdg> all'interno di files XML contenenti edizioni critiche), pensando a livelli diversi, più o meno profondi, di formalizzazione. Possiamo pensare semplicemente che in un'edizione critica in formato XML, un frammento di codice del tipo

  <rdg xml:id="f105" resp="#FJF">perfectioun</rdg>

assuma, ad un livello di rappresentazione più 'alto', la "lezione" (parola normalizzata) perfectioun, mentre un altro frammento di codice (anche all'interno dello stesso file XML) come

  <rdg xml:id="f105" resp="#FJF">perfectio<expan>u</expan>n</rdg>

'scende' ad un livello di rappresentazione più profondo, e (poiché l'editore l'ha ritenuto utile) assume temporaneamente come oggetto da rappresentare la specifica realizzazione grafica della "lezione" perfectioun nel codice.

La possibilità di aggiungere all'edizione critica digitale immagini riproducenti le fonti primarie (iscrizioni, papiri o manoscritti) permette di scendere ancora più in profondità, nel livello di informazioni relative alla tradizione testuale offerte all'editore e al fruitore dell'edizione critica: dalla rappresentazione dei fenomeni grafici tramite marcatori ed entità XML, all'immagine digitale del testimone parcellizzata (tramite procedure standard codificate anch'esse in XML) in aree rappresentanti porzioni testuali. In pratica, viene realizzato un file XML di descrizione dell'immagine, che suddivide quest'ultima in porzioni (normalmente rettangolari), identificate univocamente. In questo modo sarà possibile, all'interno del file XML contenente la normale trascrizione del testimone, istituire un collegamento tra i punti della trascrizione e le aree corrispondenti dell'immagine.

4. Il 'testo plurale'. Markup TEI/Apparatus Criticus e teorie testuali: L'esempio dell'elemento <lem>

Le specifiche TEI per la rappresentazione digitale della varianza testuale nascono da, e costituiscono sostanzialmente, una riproposizione nel medium elettronico dell'impostazione tradizionale della filologia testuale: dare notizia della variabilità del testo nei suoi testimoni, documentare e argomentare i passaggi interpretativi del processo ecdotico, ma alla fine stabilire un testo dell'editore (il più possibile vicino al testo 'giusto', ovvero al testo dell'autore).

La neutralità del markup TEI rispetto alle diverse teorie testuali è un obiettivo degli sviluppatori dello standard (vd. Robin C. Cover, Peter M. W. Robinson, Encoding textual criticism, "Computers and the Humanities", Volume 29, Issue 2, Mar 1995, Pages 123 - 136). Per questo motivo il markup proposto nel modulo Apparatus Criticus della TEI può conciliarsi con concezioni anche molto diverse della testualità. Può essere interessante, al riguardo, riflettere sulle implicazioni teoriche dell'elemento <lem> dal punto di vista della relazione tra testo 'dell'editore' e testo relegato in apparato (vd. la sezione Linking the Apparatus to the Text delle Guidelines P5).

Un discrimine importante, a livello di concezione della testualità e della varianza testuale, è costituito dalla presenza o no, all'interno delle varianti ("readings") attestate nella tradizione, di un testo scelto dall'editore (marcato in XML/TEI come <lem>. In altre parole: l'editore sceglie di presentare una delle varianti presenti nella tradizione come il testo 'giusto', il suo testo, quello che ha più probabilità di avvicinarsi alla volontà dell'autore, o di presentare tutte le varianti sullo stesso piano, secondo una concezione 'aperta' del fenomeno della varianza testuale?

Il 'Lemma' è definito nella bozza delle nuove Guidelines TEI P5 come

The reading accepted as that of the original or of the base text. [...] Those who prefer to work without the notion of a base text may prefer not to use it [the <lem> element] at all.

Come sappiamo, l'apparato può essere collegato al testo con metodi diversi, e in particolare può essere posto "in-line" o in una sezione (o file!) a parte. Si confrontino i seguenti casi.

1. Apparato 'negativo'. La variante accettata ricorre solo nel testo, come contenuto diretto dell'elemento <div>, fuori dall'<app>. Massimo dell'effetto 'testo unico':


 <div n="1.1">Testo con una variante soltanto
 testuale</div>

 <!--Altro testo--> 

  <app loc="1.1">
   <rdg wit="#B #C">variazione</rdg>
   <rdg wit="D">lezione</rdg>
  </app>

2. Lo stesso esempio può essere leggermente variato in modo da costituire un apparato 'positivo'. Il lemma ricorre sia nel testo sia nell'. In questo modo si può identificare esattamente il punto che presenta variazione testuale, ma come concezione del testo siamo allo stesso punto, in quanto la variante accettata è direttamente riportata nel testo. Le Guidelines P5 permettono di non indicare neppure i codici in cui ricorre la variante accettata nel testo dell'editore (da questo punto di vista, non si può dire, a rigore, che l'esempio che segue costituisca propriamente un apparato 'positivo'). Il 'lemma' costituisce dunque solo un 'pointer' per collegare testo ed apparato:


 <div n="1.1">Testo con una variante soltanto testuale</div>

 <!--Altro testo--> 

  <app loc="1.1">
   <lem>variante</lem>
   <rdg wit="#B #C">variazione</rdg>
   <rdg wit="D">lezione</rdg>
  </app>

2a. Nell'ottica del lemma come 'pointer', sostanzialmente rivolto all'uomo che legge l'apparato in una presentazione su schermo (e solo in prospettiva molto remota ad un programma in grado di identificare così il punto del testo interessato dalla variazione testuale), nelle Guidelines "non è proibito" abbreviare il lemma (scrivendo, nel nostro esempio, var. al posto di variante):


 <div n="1.1">Testo con una variante soltanto testuale</div>

 <!--Altro testo--> 

  <app loc="1.1">
   <lem>var.</lem>
   <rdg wit="#B #C">variazione</rdg>
   <rdg wit="D">lezione</rdg>
  </app>

3. Compiamo solo un piccolo passo nella direzione dell'"uguaglianza" tra le varianti se all'esempio precedente aggiungiamo i testimoni che presentano la lezione accettata:


 <div n="1.1">Testo con una variante soltanto
 testuale</div>

 <!--Altro testo--> 

  <app loc="1.1">
   <lem wit="#A">variante</lem>
   <rdg wit="#B #C">variazione</rdg>
   <rdg wit="D">lezione</rdg>
  </app>

4. In tutti gli esempi precedenti il lemma era incluso del testo (ed era o non era presente in apparato). Che il lemma sia presente nel testo è richiesto nei metodi di collegamento tra testo ed apparato 'Location-referenced' e 'double-end point'. Immaginiamo ora un caso diverso, nel quale la variante accettata non costituisce il contenuto diretto dell'elemento <div>, bensì è dentro l'<app>, insieme alle altre. In questo caso, il suo statuto 'privilegiato', è ancoramarcato dalla presenza dell'elemento <lem>. Un po' meno 'testo unico', ma c'è comunque l'indicazione di un testo rispetto agli altri. Si noti che il seguente esempio può essere realizzato solo se si sceglie (e si dichiara nel TEI Header) il 'Parallel segmentation method' per il rapporto testo-apparato. Di fatto testo ed apparato non vanno più 'collegati', in quanto l'<app> costituisce a tutti gli effetti parte integrante del testo (questo sarà ancora più evidente nell'esempio 6, più avanti):


 <div>Testo con una
  <app>
   <lem wit="#A">variante</lem>
   <rdg wit="#B #C">variazione</rdg>
   <rdg wit="D">modificazione</rdg>
  </app>
 testuale</div>

5. Sempre rimanendo all'interno del ventaglio delle possibilità offerte dall'XML/TEI, possiamo infine configurare una codifica in cui tutte le varianti vengano 'livellate' dall'elemento <rdg>, dentro <app>. Siamo nell'ambito del 'Parallel segmentation method', ed è evidente come l'apparato (la variazione testuale) faccia ormai parte integrante del testo: non esiste un testo-base, virtualmente indipendente dall'apparato. Il lettore-interprete deve fare i conti con la variazione testuale. Questo costituisce il massimo nella direzione del 'testo plurale':


 <div>Testo con una
  <app>
   <rdg wit="#A">variante</rdg>
   <rdg wit="#B #C">variazione</rdg>
   <rdg wit="D">modificazione</rdg>
  </app>
 testuale</div>

5a. In quest'ultimo caso è possibile arricchire l'apparato con una discussione dell'editore/codificatore sulle diverse varianti, dove troverebbe spazio l'indispensabile intervento 'scientifico' del filologo testuale. Tale discussione potrebbe essere ospitata da un elemento <note>, e i suoi risultati potrebbero essere formalizzati, all'interno dei tags <rdg>, tramite gradi di certainty dei readings, di cui l'editore si prende (tramite l'attributo resp) la responsabilità:


 <div>Testo con una
  <app id="a001" resp="PM">
   <rdg wit="#A" cert="0.80">variante</rdg>
   <rdg wit="#B #C" cert="0.15">variazione</rdg>
   <rdg wit="D" cert="0.05">modificazione</rdg>
  </app>
 testuale</div>

  <note target="a001">
    La lezione di A è preferibile per i
    seguenti motivi... anche in considerazione
    dell'<hi rend="it">usus scribendi</hi> dell'autore:
    cfr. i seguenti passi... Convince meno l'ipotesi di <bibl>M.
    Rossi, <title>...</title></bibl>, il quale difende
    <q>variazione</q> in quanto <hi rend="it">lectio
    difficilior</hi>...
  </note>

Nel caso in cui la lista dei testimoni (e il markup relativo alle lacune e ai testimoni frammentari) siano ben curati e 'completi', le considerazioni precedenti valgono meno. In questo caso, infatti, che il lemma sia ripetuto in apparato o no (apparato 'positivo' o 'negativo') è del tutto indifferente. E' infatti sempre possibile, da parte della macchina, ricostruire quali testimoni riportano la lezione accettata (il 'lemma'): si tratta, all'interno dei testimoni che riportino quella porzione di testo, di quelli che non vengono citati in apparato.

L''indice di pluralità testuale' veicolato dal markup può dunque essere così riformulato:

Edizioni elettroniche che non riportino una lista completa di testimoni, e che rientrino nei casi 1-2 ipotizzati sopra (in un punto, le Guidelines accennano alla possibilità di questo caso: davvero, i responsabili della TEI vogliono venire incontro a tutti...);
Edizioni elettroniche che non riportino una lista completa di testimoni, ma rientrino nei casi 3-4, ed edizioni elettroniche che riportino una lista completa di testimoni che rientrino (quasi indifferentemente) in uno dei casi dall'1 al 4. Il "quasi indifferentemente" è legato ad un discrimine prevalentemente simbolico: la scelta di includere la lezione accettata direttamente nel testo edito (come contenuto diretto dell'elemento <div>) o no. In ogni caso, la presenza dell'elemento <lem> determina un testo di statuto 'privilegiato', scelto dall'editore/codificatore, e questo è un elemento che accomuna i casi 1-4. Eppure una differenza importante tra i casi 1-3 ed il 4, determinata dalla scelta del 'Parallel segmentation method', esiste: la scelta di questo metodo implica che di fatto il testo, senza l'apparato, non sia completo. Certo, un'applicazione può facilmente 'integrare' il testo incompleto prendendo il lemma dall'apparato, ma si tratta comunque di un'operazione da svolgere a livello di elaborazione del testo. I due altri metodi, per parte loro, presuppongono un testo sostanzialmente indipendente dall'apparato: quest'ultimo è un optional che può infatti trovarsi anche in un file separato, e può essere aggiunto in un secondo momento (in un file separato, appunto) ad un file già marcato senza alcuna attenzione all'aspetto delle varianti testuali (ad es. tramite il metodo del 'Double-ending Attachment', usato con riferimenti complessi ai punti precisi del file contenente il testo 'non critico').
Edizioni elettroniche che rientrino nel caso 5 sopra ipotizzato.

Va da sè, naturalmente, che un foglio di trasformazione XSLT, o un software di elaborazione dell'XML, può "ovverride" le implicazioni teorico-testuali dell'elemento <lem>, e porre tutte le <rdg> sullo stesso piano. Ma dall'avvicinamento della lente dell'osservazione all'effettivo codice TEI emergono due considerazioni generali:

da una parte la proposta TEI permette di realizzare pratiche editoriali digitali rispondenti a concezioni assai diverse della testualità (la neutralità rispetto ad esse, come si è anticipato subito, è uno degli obiettivi del gruppo di lavoro "Textual criticism" della TEI);
ma allo stesso tempo quello esaminato costituisce un esempio concreto di come lo stesso medium digitale permetta lo sviluppo di tecniche di rappresentazione del testo facenti riferimento ad un modello 'aperto' del testo stesso dal punto di vista della varianza testuale. Tali soluzioni ecdotiche erano di fatto impossibili, almeno oltre un certo livello di complessità, di 'pluralità' del testo, all'interno della "Galassia Gutenberg".

5. Il testo 'fluido' e l'edizione come database

I punti di debolezza dell'XML/TEI come metodo per rappresentare i testi sono riassumibili in due punti fondamentali:

In generale, le restrizioni imposte dalla sintassi formale SGML (nidificazione e impossibilità di rappresentare gerarchie concorrenti);
In particolare, per quanto riguarda la varianza testuale, la possibilità di fatto di rappresentare, con le procedure della TEI/Apparatus Criticus, solo variae lectiones a livello di lettera, parola o piccole porzioni di testo.

Abbiamo visto come, ancora 'all'interno' del markup TEI, sia possibile rappresentare varianti testuali di porzioni non troppo estese di testo in modo 'aperto', senza privilegiare una lezione nei confronti di un'altra. Tramite l'uso del tag <app> ed un collegamento 'in-line' tra testo ed apparato, diventa anzi possibile (superando le restrizioni imposte dal medium cartaceo) pubblicare un testo secondo una concezione 'aperta' della testualità e della varianza.

Quando però la varianza testuale diventa più estesa e radicale, e si tratta di pubblicare testi a tradizione 'fluida', in cui ogni manoscritto differisce notevolmente dall'altro, si presenta la necessità di applicare nuove tecniche, diverse dalla stampa ed anche dal markup TEI/Apparatus Criticus. Tecnologie basate su DBMS, Database Managment Systems.

Dino Buzzetti, storico della filosofia antica e teorico dell'e-philology, ha proposto riflessioni interessanti al riguardo. Vd. ad esempio il suo articolo negli atti del convegno Soluzioni informatiche e telematiche per la filologia, Pavia, 30-31 marzo 2000 (a c. di Simone Albonico) per l'aspetto puramente teorico (i problemi del markup SGML-based in termini di interferenza tra struttura dell'espressione - le limitazioni SGML - e struttura del contenuto).

In un'intervista del 1995 rilasciata alla trasmissione Rai Mediamente, Buzzetti poneva così la questione:

Lo strumento informatico non è tanto uno strumento pratico per aiutare nel modo tradizionale in cui si preparano le edizioni, per esempio, per produrre un testo stampato con diversi livelli di note di apparato dell'edizione critica. Non è in questo senso. Esistono sistemi molto sviluppati, per fare questo tipo di lavoro. Invece ci si è presentata la necessità di usare l'informatica di fronte ad un problema filologico del testo, che non poteva essere risolto con altri mezzi. Avevamo dei testi a tradizione, cosiddetta "fluida", ciascuna copia manoscritta diversa dall'altra e quindi non confrontabile, non collazionabile con le tecniche classiche. La risposta ovvia è stata creare un database contenente sia le trascrizioni, sia le immagini digitali delle fonti manoscritte.

L'applicazione delle sue teorie è rappresentata dalla sua edizione di opere di insegnamento universitario della Bologna del '300, per la quale è stato utilizzato il DBMS 'Kleio', sviluppato da Manfred Thaller, del Max-Planck-Institut fuer Geschichte di Goettingen. Vd. ad es. D. Buzzetti, P. Pari, A. Tabarroni, Libri e maestri a Bologna nel XIV secolo: un’edizione come “database”, in "Schede Umanistiche”, n.s. II, 2, 1992, pp. 163-169. Non è questa, comunque, l'unica sua pubblicazione al riguardo: vd. qui una selezione della sua bibliografia. Tra le sue pubblicazioni scaricabili online, vd. Database Edition of Non-collatable Textual Tradition , in The Electronic Scriptorium (1997).

Come esempi di testi fluidi, Buzzetti cita:

La tradizione medievale di testi come il Chevalier de la Charrette di Chrétien de Troyes, per cui rimanda all'edizione di Princeton, realizzata appunto come database. A tal proposito, nell'intervista citata prima, dice:

L'edizione critica risulta, rispetto a questo tipo di testualità, un'invenzione dell'editore, un editore ottocentesco o attuale. Come fare ricerche lessicali sull'uso delle espressioni dialettali, sul rapporto tra diversi usi linguistici, lavorando su di un materiale costruito artificialmente e non rifacendoci alle fonti originali? Quindi il database può essere una forma di rappresentazione adeguata di forme di testualità diverse da quella canonizzata dal libro a stampa.

Il secondo campo di applicazione che egli individua sono "i manoscritti dell'autore lasciati incompiuti".

Fondamentale il passaggio dell'intervista a Mediamente in cui Buzzetti definisce i criteri in base ai quali un archivio delle fonti documentarie diventa un'edizione (enfasi mia):

Allora quali requisiti deve avere questa forma di rappresentazione, per potere essere considerata una edizione? Secondo noi, introdurre procedure computazionali, che svolgano su questo materiale la stessa funzione che in una edizione critica svolge l'apparato, un filtro per potere filtrare l'informazione e presentare un'opzione possibile, ma un'opzione sempre rivedibile, perché consente il confronto diretto con la fonte.

Molto importante, nel modello di Buzzetti, è che il database presenti l'immagine accanto al testo. Si tratta della stessa linea di indagine su cui al convegno "Digital Philology and Medieval Texts" di Arezzo Arianna Ciula ha impostato il suo workshop.

Un problema identificato da Buzzetti (sempre nell'intervista a Mediamente) è costituito dalla standardizzazione dei formati:

Quindi occorre prevedere dei meccanismi di esportazione o importazione tra diversi sistemi, in modo da potere utilizzare i dati con la forma strutturata, che è stata loro attribuita da chi li ha elaborati. Scambiare le trascrizioni, in quanto tali, o scambiare le immagini, è relativamente semplice. Quello che non si riesce allo stato attuale a scambiare è il modo in cui noi le abbiamo organizzate. Questo comporta lo sviluppo di un certo formato del file, che consente il travaso, per esempio, di un'immagine, insieme con tutta la descrizione logica del suo contenuto, un'immagine insieme con la trascrizione.

Riassumendo, se il markup TEI/Transcription può risultare comunque prezioso per trascrivere i singoli testimoni, al momento della realizzazione dell'edizione critica (cioé di un'edizione che dia conto, in qualche modo, della varianza testuale) si aprono all'editore due strade, a seconda della sua concezione della testualità, ma anche del livello di varianza del testo in esame:

Creare un file XML secondo il modulo TEI/Apparatus Criticus, che è sostanzialmente la rappresentazione di un modello unitario del testo, ovvero di un testo, con delle varianti riguardanti limitate;
Creare un database che colleghi le trascrizioni (anche XML/TEI) dei singoli testimoni tra di loro, ed eventualmente con le immagini digitali a loro relative.

Paolo Monella, Università di Palermo

Un panorama delle iniziative
di filologia digitale

NB: molti di questi progetti sono recensiti dalla dott.ssa Cinzia Pusceddu sul sito Digital Variants. Le citazioni tratte dalle sue schede sono qui di seguito marcate in corsivo.

A. Edizioni digitali non scientifiche

A1. Edizioni non scientifiche e archivi testuali, basati sulla digitalizzazione di edizioni cartacee, con apparato multimediale (immagini ed altro)

Oxford Text Archive (Lou Burnard): Si segnala in quanto costituisce di uno dei maggiori archivi mondiali di testi letterari, ed uno dei primi ad essere stati codificati in XML/TEI. Ma comunque non si tratta di edizioni critiche.
La BIT, Biblioteca Italiana Telematica (online): La TEI applicata al più grande corpus di testi italiani online. Il sito è collegato al portale Internet culturale.
Le sue specifiche tecniche dichiarano che i testi sono tutti conformi alla TEI, a due livelli di 'profondità' del markup già realizzati (ma i livelli previsti sono cinque, laddove 5 è l'edizione critica elettronica). Al progetto lavora anche Fabio Ciotti. Costituisce un esempio di come anche un corpus di testi elettronici non marcati in modo dicharativo (quali per esempio database come TLG e BTL) possano essere successivamente adeguati agli standard più avanzati della filologia digitale.
Clicca qui per una presentazione del progetto da parte del dott. Tavosanis.
Life and Times di Chaucer (offline): Basata su un'edizione cartacea recente, con foto dei manoscritti ed altro.
Trobadors: concordanze della lirica trobadorica (offline): Il corpus della poesia occitanica secondo il Répertoire métrique di István Frank, basato sulle edizioni maggiormente accreditate o recenti.
Si tratta di un archivio testuale. Qualcosa di simile a basi di dati come TLG, PHI5 o BTL. Senza immagini nè alcun riferimento alle fonti primarie.
Letteratura Italiana Einaudi (offline): Archivio in 10 CD-ROM comprendente: testi integrali dei maggiori autori della letteratura italiana.
Nessun riferimento alle fonti primarie. È presente un apparato multimediale, ma non in funzione critico-testuale.
Virginia Woolf (offline): Archivio dell’opera completa di Virginia Woolf, in diverse edizioni a stampa e inclusi diari e saggi. Oltre ai testi, anche le immagini di manoscritti, diari, lettere, una registrazione audio della voce della scrittrice e uno studio critico recente, Virginia Woolf A-Z, del curatore dell’edizione elettronica.
Digital Dante (online): Archivio testuale multimediale.
Gustave Flaubert (online): Archivio testuale mutimediale.
Dante online (online): Archivio testuale multimediale.
Electronic Text Center (online): All’ETC dell’Università della Virginia, archivio di testi elettronici online e offline, codificati in SGML e XML, abbinati a immagini e raggruppati per categoria linguistica. A disposizione degli utenti anche fornitura di hardware e software per la produzione e l’analisi di testi.
Si tratta di testi non critici: non c'è descrizione dei testimoni, né apparato critico.
Schoenberg Center of Electronic Text and Image (online): Archivio all’Università della Pennsylvania comprendente dipinti, lettere, manoscritti, testi a stampa di autori vari, noti o anonimi.
Anche qui si tratta di testi non critici: non c'è descrizione dei testimoni, né apparato critico. La loro attività è rivolta soprattutto alla scansione (e, a quanto pare, all'OCR) di testi a stampa.
Manuscript fragments bound in books (online): Collezione di manoscritti in latino castigliani e inglesi e di frammenti in pergamena o su carta al sito Bibliographics. [...] Uno dei frame è apposito per trascrivere, tradurre o commentare il testo e inviare la propria proposta.
The Vergil Project (online): Progetto su Virgilio realizzato da studenti e insegnanti all’Università della Pennsylvania. [...] [È presente] uno spazio di lavoro che permette, previa iscrizione, di inviare e modificare continuamente le analisi, grammaticali o sintattiche, le traduzioni, i commenti già inviati.
La collaborazione della community sembra richiesta più a fini didattici che scientifici.
An Interactive Finnegans Wake Notebook Page (online): Il curatore ignoto di questa pagina (amatore o studioso) richiede esplicitamente la collaborazione di una world community per decifrare e interpretare una pagina dei quaderni usati da Joyce nella composizione del Finnengans Wake, con molte cancellature e riscritture
Ivanhoe. A game of textual manipulation (online): Gioco interattivo ideato da J. McGann. Per iniziare bisogna assumere una precisa identità e un alias con cui presentarsi, definire la propria reale identità (che viene svelata solo quando si esce dal gioco) e le caratteristiche del ruolo che si assume. Si può creare un nuovo gioco, scegliendo tra 4 testi base (Ivanhoe, Tristham Shandy, Neuromancer, A rose for Emily), invitando altri giocatori a giocare o osservare, o entrare in uno dei giochi in corso. Lo scopo è intervenire sul testo dato con inserzioni proprie in un qualunque punto. Le aggiunte possono essere lineari (indistinguibili o riconoscibili per colore diverso) o ipertestuali (il nome dell’aggiunta è un link nel corpo del testo). Si possono anche stabilire relazioni tra due o più unità testuali attraverso icone.
Geniale nell'impostazione, indica una concezione della testualità estremamente 'aperta': il testo 'classico' può essere manipolato dai moderni, all'interno di un 'gioco di ruolo testuale'.
Medieval Palaeography (online): Corso di paleografia e diplomatica all’Università di Leicester, articolato in numerose sezioni, tra le quali introduzioni generali sulle discipline, manuali, schede, questionari interattivi, bibliografia, glossario, immagini, note grammaticali, confronto in parallelo di testi. Sono anche disponibili un form in cui inserire le proprie proposte di traduzione e commento e uno per suggerimenti relativi al sito.
L'aspetto collaborativo sta nel form citato sopra. Ma naturalmente l'impostazione principale è didattica.
MASTER Manuscript Access through Standards for Electronic Records (online): Progetto finanziato dall’Unione Europea e promosso da P. Robinson. L’obiettivo è creare un catalogo online dei manoscritti medievali raccolti nelle diverse biblioteche europee, codificati secondo gli standard internazionali SGML/XML della TEI, che è tra i partner del progetto. MASTER mette a disposizione sul sito Internet la documentazione sugli standard (interna al progetto e ufficiale) e i software sviluppati per la codifica dei manoscritti (NoteTab, text-editor SGML/XML per Windows, download gratuito; parser SGML/XML e viewer XML online; database MA i cui dati possono essere esportati in SGML/XML). Si può inoltre accedere al prototipo di catalogo online che si trova nelle università di Leicester e Oxford per consultare le descrizioni di manoscritti già disponibili o inserirne di nuove.
MALVINE Manuscripts And Letters Via Integrated Networks in Europe (online): Il progetto mira a collegare in rete quelle istituzioni europee che conservino manoscritti moderni e lettere (biblioteche, archivi, centri, musei) per formare un unico database di risorse accessibile a chiunque sul Web. Interfaccia multilingue e sviluppo del multi-site search engine MALVINE, che consente la condivisione dell’informazione indipendentemente dalle diverse soluzioni tecniche o applicazioni Web adottate dalle singole istituzioni che vogliano collegarsi.
Hypernietzsche (online): Progetto cooordinato da P. D’Iorio dell’ITEM – CNRS. L’obiettivo è “creare un’infrastruttura di lavoro collettivo in rete”, inizialmente incentrata su Nietzsche, poi allargata alle scienze umane in genere. L’informazione dell’ipertesto è strutturata in Materiali (opere, lettere, manoscritti, libri annotati, documenti biografici del filosofo), Contributi (trascrizioni, edizioni, percorsi secondo linee cronologiche, tematiche e genetiche, commenti brevi di varia natura, saggi, bibliografia), Autori (curriculum scientifico ed elenco pubblicazioni. Per una presentazione completa del progetto vedi D’Iorio 2000. Il volume è disponibile anche online.

C2. I testi visuali

TextArc (online): Rappresentazione testuale visiva in Java, ideata da W. Bradford Paley della Digital Image Design Incorporated. Il testo scelto (Amleto, Alice e molti altri messi a disposizione dal Project Gutenberg) è racchiuso in un ovale, che ha linee ai bordi, e parole all’interno. Una parola più frequente è più luminosa; raggi in oro la collegano a tutte le parti del testo in cui appare, che scorrono lungo le linee dei bordi (considerando l’inizio alle 12 e procedendo in senso orario). Linee curve uniscono nell’ovale tutte le occorrenze di un dato termine. Si può anche scegliere l’opzione show text per aprire una finestra in modalità di lettura lineare, o concordance per avere il numero di occorrenze di ogni parola.
Visual Thesaurus (online): Thesaurus della lingua inglese. Le parole appaiono nello spazio, collegate per senso da raggi; quella che viene selezionata, diventa la base rispetto alla quale sono dati i sinonimi, e si sposta al centro. Si può interrogare per quattro categorie grammaticali (nomi, verbi, avverbi, aggettivi), modificare il modo in cui appaiono le parole (quantità dei dati, dimensioni del grafo, dimensioni dei caratteri), cambiare lo spazio (2D o 3D).

Paolo Monella, Università di Palermo

Edizioni digitali su testi dell'antichità classica

I progetti che non ci sono

Tra i progetti di edizioni digitali scientifiche fin qui esaminati (la categoria B della lista), nessuno riguarda direttamente i testi dell'antichità greco-latina, eccetto The Vergil Project, di cui pure abbiamo evidenziato il valore più didattico che scientifico. Potremmo ancora menzionare il Corpus dei Manoscritti Copti Letterari, e i progetti The Confessions of Augustine: An Electronic Edition e Aurelii Augustini. Enarratio in psalmus. Ma è significativo come, per trovare dei veri progetti di filologia digitale (tra i quali peraltro spicca per novità di impostazione solo il progetto di T. Orlandi sui manoscritti copti), si debba uscire dall'ambito della tradizionale periodizzazione della letteratura classica, e, nel caso del progetto sui testi copti, addirittura dall'ambito delle lingue classiche.

Nella sua rassegna di progetti di editoria digitale, Patrick Sahle fa menzione dell'attività editoriale dell'editore Brepols (l'editore, tra l'altro, di BTL e CLCLT). Ma (significativamente?) non menziona le pubblicazioni di interesse classicistico tra le principali realizzazione della casa editrice, e sulle scelte tecnico-metodologiche di codifica del testo di quest'ultima esprime un giudizio forse senza infamia, ma sicuramente senza lode (enfasi mia):

Der Belgische Verlag Brepols vetreibt eine ganze Reihe großer Text- und Quellensammlungen, die im allgemeinen unter einem Plain-Text/Datenbank-Paradigma organisiert sind und zu denen ich wegen der restriktiven Preispolitik keine allzu fundierte Kritik abgeben kann. Die etwas sonderbare Verlagspolitik, die man auch als fehlendes Interesse an grundsätzlichen und konzeptionellen Fragen digitaler Publikationen beschreiben könnte, zeigt sich auch darin, daß noch im Dezember 1999 auf einer Seite vom Mai 1998 die zukünftigen Ausgaben des Jahres 1997 angekündigt werden! Als Sammlungen von Editionstexten im weitesten Sinne sind aufzufassen: Monumenta Germaniae Historica (eMGH), The Papal Letters, The Archive of Celtic-Latin Literature (ACLL) und der Thesaurus Diplomaticus.

Oltre a questa 'non-citazione' dei Cd-Rom, per noi classicisti così importanti, della Brepols, non si trova nella pur ricca rassegna del dott. Sahle alcuna altra notizia di progetti riguardanti la letteratura greco-latina, eccettuato il nostro S. Agostino, che, dopo aver tenuto a battesimo (con gli studi di Padre Roberto Busa) l'era dell'informatica umanistica, fa la sua comparsa anche qui in virtù del Corpus Augustinianum Gissense su Cd-Rom.

I testi classici sono assenti anche dal progetto Signum di editoria elettronica in XML della Scuola Normale Superiore di Pisa, per quanto al progetto lavorino anche studiosi di profilo classicistico come Marzia Bonfanti. Nel recente convegno "XML per i Beni Culturali" (Pisa, 25 marzo 2004), i cui atti sono in uscita, non si trovano relazioni su progetti legati alle letterature classiche.

A1. Edizioni non scientifiche e archivi testuali, basati sulla digitalizzazione di edizioni cartacee, con apparato multimediale (immagini ed altro)

The Latin Library (online): Un ampio archivio di testi latini in formato HTML. Gli esempi di questo tipo di archivi per il mondo classico potrebbero moltiplicarsi.
The Internet Classics Archive - MIT (online): Attualmente 'terremotato' da una recente perdita di dati sul server. Per i testi, si appoggia notevolmente al Perseus Project. Quelli che riporta, non sono editi criticamente.
Offre però la possibilità di aggiungere (come in un forum) post di commento ai testi.

B3. Ancora edizioni digitali su tradizioni unitestimoniali, ma di molti testi diversi, ovvero archivi di trascrizioni di fonti primarie

Papirologia

Papyrology at Oxford (online): Ospita dei database di immagini di papiri dai siti di Ossirinco e di Ercolano.
Duke Databank of Documentary Papyri (online): Prima disponibile in Cd-Rom, ora ne è presente una versione più aggiornata online (all'interno del sito del Perseus Project)
PSI online: Il progetto è in corso: vd. una recente presentazione del progetto: "Scopo dell’iniziativa è la realizzazione di una sorta di ‘ricostruzione virtuale’, fruibile via internet, della collezione di papiri (più di 1500 reperti) messa insieme, attraverso decenni di scavi archeologici e missioni in Egitto, dalla “Società italiana per la ricerca dei papiri greci e latini in Egitto” (poi divenuta l’Istituto Papirologico Vitelli)".
Gestione informatizzata di archivi di papiri medici greci e di varie edizioni a stampa del testo del Contradicentium medicorum di Gerolamo Cardano (notizia del progetto di ricerca): Andrea Bozzi, presso l'ILC (Istituto di Linguistica Computazionale) del CNR di Pisa, applica la filologia digitale (incluso il trattamento di immagini), ma ancora una volta, almeno per quanto riguarda i papiri, a testimoni unici.

Epigrafia

EpiDoc: Epigraphic Documents in TEI XML (online): L'obiettivo di EpiDoc è stabilire standard XML/TEI per la creazione di databases di iscrizioni. I progetti in corso sono: Aphrodisias in Late Antiquity (ALA2004); Inscriptions of Aphrodisias (InsAph); U.S. Epigraphy Project (USEP); Vindolanda Tablets Online.

B. Edizioni scientifiche digitali

Center for Hellenic Studies, Harvard: Classics@, Issue 2 (online): Il secondo numero della rivista online ddel CHS di Harvard, che apparirà online all'inizio di giugno 2006, presenterà i risultati di un workshop (tenutosi a giugno 2003) in cui si sono discussi dei progetti di applicazione delle tecnologie informatiche (legate ad Internet, ma in qualche caso forse anche nella direzione della filologia digitale) a testi classici, tra cui Omero. In realtà, le notizie riportate attualmente sul sito sul workshop e sui progetti da avviare non lasciano comprendere l'esatta natura dei progetti stessi.
Homer and the Papyri (online): Il progetto del Center for Hellenic Studies di Harvard si pone in realtà a metà strada tra la categoria B3/Papirologia, descritta sopra, e la presente. Si tratta di un database delle sole lezioni varianti al testo dei poemi omerici che si ritrovano in papiri. Di fatto, non è presente alcuna edizione del testo, però è possibile, per ogni passo dei due poemi, conoscere le varianti rintracciabili in un vasto numero di papiri, il che può essere considerato in qualche modo una diversa forma di apparato critico.
Il commento di Galeno al ΠΕΡΙ ΑΡΘΡΩΝ di Ippocrate (online): All'interno del sito del Corpus Medicorum Graecorum-Latinorum Project, Christian Brockmann ha pubblicato questa vera e propria edizione critica digitale, di cui non è dichiarato (almeno nella presentazione contenuta sul sito) il linguaggio di codifica, ma che presenta un apparato critico interattivo e la possibilità di visualizzare le riproduzioni dei manoscritti.
Filologia biblica
Digital Nestle-Aland Prototype e New Testament Transcripts Prototype (entrambi online: vd. Nestle-Aland e New Testament Transcripts): Nel campo della filologia biblica i progetti più importanti sono i due legati all'Università di Münster. Il Digital Nestle-Aland Prototype presenta il testo dell'edizione critica cartacea Nestle-Aland di due soli libri del Nuovo Testamento (la prima e la seconda lettera di Giovanni, ma costituisce una vera e propria edizione critica digitale: l'apparato critico interattivo non è solo una digitalizzazione di quello cartaceo, bensì è basato su nuove trascrizioni digitali di 24 manoscritti. Queste ultime sono visualizzabili in modo indipendente. La possibilità di visualizzare la varianza testuale in molti modi (confrontando due testi, con apparato critico parola-per-parola, verso-per-verso, visualizzando il testo di uno dei 24 testimoni etc.) lascia supporre una codifica dichiarativa e non procedurale delle varianti.
Mentre il prototipo della versione digitale del Nestle-Aland riporta tutti i 24 manoscritti (dunque un apparato critico completo), ma per soli due libri (Giovanni 1 e 2), l'altro progetto portato avanti dalla stessa Università di Münster, il New Testament Transcripts Project, presenta un'edizione critica digitale di tutti i libri del Nuovo Testamento basata sugli stessi principi (e dotata della stessa interfaccia utente), ma, costituendo un work in progress, non presenta per tutti i libri tutti i testimoni, ma un numero di manoscritti variabile tra 2 e 26.
The Online Critical Pseudepigrapha project (online): Un'edizione digitale di testi pseudoepigrafi del Vecchio Testamento. Alcune di tali edizioni sono dotate di apparato critico. In questi casi, il testo critico è codificato secondo un markup dichiarativo (XML) simile, ma non coincidente, con le specifiche TEI per il Critical Apparatus. I testi critici sono: Enoch (editore: Ken Penner); Testamento di Adamo (editore: Ken Penner); Testament of Job (editori: Ian Scott, con Ken Penner e David Miller).

L'edizione scientifica digitale

Cinzia Pusceddu al CLiP 2001: una storia della filologia elettronica

0. Edizioni non scientifiche (codifiche procedurali)

1. Modi diversi dall'XML/TEI di codificare in modo digitale la varianza testuale (soprattutto tramite codifiche procedurali)

2. La codifica XML/TEI - modulo Critical Apparatus

3. La codifica XML/TEI - modulo Transcription of Primary Sources

Problemi teorici nella mescolanza tra i due set di marcatori

Trascrizione dei testimoni ed immagini digitali

4. Il 'testo plurale'. Markup TEI/Apparatus Criticus e teorie testuali: L'esempio dell'elemento <lem>

5. Il testo 'fluido' e l'edizione come database

Un panorama delle iniziative
di filologia digitale

A. Edizioni digitali non scientifiche

A1. Edizioni non scientifiche e archivi testuali, basati sulla digitalizzazione di edizioni cartacee, con apparato multimediale (immagini ed altro)

B. Edizioni digitali scientifiche

B1. Edizioni scientifiche condotte con metodologia tradizionale, i cui soli risultati sono presentati in formato digitale

B2. Edizioni digitali scientifiche su tradizioni unitestimoniali

B3. Ancora edizioni digitali su tradizioni unitestimoniali, ma di molti testi diversi, ovvero archivi di trascrizioni di fonti primarie

B4. Edizioni scientifiche su testimonianze d'autore (anche complesse)

B5. Edizioni scientifiche digitali su tradizioni pluritestimoniali

C. Nuove forme di testualità

C1. Archivi collaborativi

C2. I testi visuali

Edizioni digitali su testi dell'antichità classica

I progetti che non ci sono

A1. Edizioni non scientifiche e archivi testuali, basati sulla digitalizzazione di edizioni cartacee, con apparato multimediale (immagini ed altro)

B3. Ancora edizioni digitali su tradizioni unitestimoniali, ma di molti testi diversi, ovvero archivi di trascrizioni di fonti primarie

Papirologia

Epigrafia

B. Edizioni scientifiche digitali

Filologia biblica

L'orgoglio dei classicisti: le banche dati testuali

L'edizione scientifica digitale

Cinzia Pusceddu al CLiP 2001: una storia della filologia elettronica

0. Edizioni non scientifiche (codifiche procedurali)

1. Modi diversi dall'XML/TEI di codificare in modo digitale la varianza testuale (soprattutto tramite codifiche procedurali)

2. La codifica XML/TEI - modulo Critical Apparatus

3. La codifica XML/TEI - modulo Transcription of Primary Sources

Problemi teorici nella mescolanza tra i due set di marcatori

Trascrizione dei testimoni ed immagini digitali

4. Il 'testo plurale'. Markup TEI/Apparatus Criticus e teorie testuali: L'esempio dell'elemento <lem>

5. Il testo 'fluido' e l'edizione come database

Un panorama delle iniziative di filologia digitale

A. Edizioni digitali non scientifiche

A1. Edizioni non scientifiche e archivi testuali, basati sulla digitalizzazione di edizioni cartacee, con apparato multimediale (immagini ed altro)

B. Edizioni digitali scientifiche

B1. Edizioni scientifiche condotte con metodologia tradizionale, i cui soli risultati sono presentati in formato digitale

B2. Edizioni digitali scientifiche su tradizioni unitestimoniali

B3. Ancora edizioni digitali su tradizioni unitestimoniali, ma di molti testi diversi, ovvero archivi di trascrizioni di fonti primarie

B4. Edizioni scientifiche su testimonianze d'autore (anche complesse)

B5. Edizioni scientifiche digitali su tradizioni pluritestimoniali

C. Nuove forme di testualità

C1. Archivi collaborativi

C2. I testi visuali

Edizioni digitali su testi dell'antichità classica

I progetti che non ci sono

A1. Edizioni non scientifiche e archivi testuali, basati sulla digitalizzazione di edizioni cartacee, con apparato multimediale (immagini ed altro)

B3. Ancora edizioni digitali su tradizioni unitestimoniali, ma di molti testi diversi, ovvero archivi di trascrizioni di fonti primarie

Papirologia

Epigrafia

B. Edizioni scientifiche digitali

Filologia biblica

L'orgoglio dei classicisti: le banche dati testuali

Un panorama delle iniziative
di filologia digitale