These are some tentative outlines of a talk that I delivered at the round table on Digital Philology L'Informatica Umanistica e i suoi problemi: l'edizione critica digitale dei testi. Speakers: Tito Orlandi, Raul Mordenti and Paolo Monella. Accademia dei Lincei, 20 June 2012, Rome (programme).
Further materials on my talk (slides etc.) are here.
During the talk (and in the related slides) I only covered sections A and B of version 2.3eng below).
Index:
Melissa Terras' infographic Mostly UK/US/CA Displaying "The moment of DH" quantity mainstream institutionalisation Issues where what how
Big picture. Sources: M. Terras centerNet list centerNet big map Focus on nations (both research and teaching). Sources: UK centerNet 2 centres in LON terras USA centerNet survey http://www.clir.org/pubs/reports/pub143/contents.html Canada Rockwell (see link in Fiormonte/proposta) http://tapor.ualberta.ca/taporwiki/index.php/ The_Academic_Capacity_of_the_Di-gital_Humanities_in_Canada France Aurélien Berra's post map 'DH francophone' Germany DHd blog Cologne Center for eHumanities http://www.cceh.uni-koeln.de/node/11 Italy centerNet Orlandi/Montevarchi (for centres) Fiormonte/appendice (n. 9 for teaching - check updates) Fiormonte/digitalvariants? myself? Centres and infrastructures. Sources: Fiormonte/appendice (paragraph 2) my own list
1. pioneers (late '40s and '50s) 2. pioneer applications ('60s) 3. experimenting ('70s and '80s) Computing in the Humanities US, UK, EU 4. triumph of technology ('90s and 2000s) Digital Humanities US & UK; EU a. tools SGML, XML, TEI Unicode WWW and HTML Databases GIS b. products textual corpora Wikipedia c. institutions centres programmes d. discussion groups and conferences
Context: Microsoft approach (digital tools to anyone) 2000 digital bubble Focus switch phase 3: Computing in the Humanities (focus on methods) phase 4: Digital Humanities (focus on application) Job profiles: tension between 'digital' and 'humanities' analysts vs. developers best: humanists who can programme and produce tools
The 'Microsoft' approach a. humanists who can programme create tools DH research through building b. these tools are given to unaware 'traditional' humanists, 'users' application (testing) Argument 1: all humanists will use DH tools when they'll become easier Argument 2: DH will eventually disappear and coincide with the Humanities when all humanists will use digital tools prepared today
[I might omit this section in my talk] We all use MS Word But we are not all DHers because MS World does not add up any computational process to our research methods (only presentational features)
[I probably should shorten up this section in my talk] Fact: humanists don't use the DH tools today ('Microsoft' approach's failure). Why? 1) Today, DH models are still under development. Some examples from a relatively well-developed field, digital philology: - simple multi-testimonial textual traditions (Uncle Tom's Cabin edition) - XML-TEI Apparatus Criticus module - few additional technologies needed (Oxygen, web) - complex multi-testimonial textual traditions (Medieval MSS, e. g. The Canterbury Tales Project) - XML-TEI Transcription of Primary Sources - but: - TEI limits (see Peter Robinson's criticism of TEI) - additional technologies needed (collate, DBs) - often DBs are used for internal use - Desmond Schmidt: models alternative to XML for textual variance - TEI evolution (MSS interest group) - genetic editions (Digital Variants, Proust, Faust, Baroness) - XML-TEI and Versioning Machine - but: - new models needed (Fiormonte and Schmidt) - TEI evolution (Elena Pierazzo, genetic editions interest group) - Homer Multitext - importance of data architecture - CTS (Canonical Text Reference): the issue of text alignment - edition of single manuscript - digital facsimiles - standard technology for text-image linking - XML-TEI Transcription of Primary Sources - but: - specific problems (es.: Malte Rehbein: an evolving Medieval MS) - epigraphy - EpiDoc (XML-TEI) - but: - alternative models (EpiDoc vs. EAGLE-Database) - papyrology - SoSOL - evolution of EpiDoc (XML-TEI) - but: - complex data architecture for crowdsourcing 2) Tomorrow a. For some text categories (e. g. epigraphy above) there will be standard models, therefore 'tools' of the kind of the 'Microsoft' approach. In those cases, I agree with argument 2: the mere application won't be DH, but just digitally-assisted Humanities b. But every textual category and, in a way, every single textual tradition requires the scholarly editor (even in the print environment) to create a specific model for it: - a model of the textual tradition - a model of the text that (s)he wants to publish - a model for his/her edition. Thus the scholarly editor in the digital environment must be able to 'tweak' the engine of the digital 'tool' (s)he's adopting to adapt it. Two examples: - genetic edition: what if there is an author's prose summary to align to the versions of a poem? - epigraphy: what if a text is both on stone and in some MSS? Father Busa: DH is not making old things with new tools, nor making old things in a new way, but making new things. This is DH to me, and there will always be research to do in this field (as opposed to argument 2 above).
[Some graphics needed here] Anglo-centrism UK & USA EU Texto-centrism Text and Language Philology & Literature Editions One example per typology (see above)? Linguistics Academic Computational linguistics Ex.: Perseus (English) Corpus linguistics Ex.: ? (Pisa?) Corporate Data mining Ex.: Facebook Semantic Web Ex.: RDF vs. Microdata, or Pleiades (Linked Open Data) Computer translation Ex.: Google Translate Other humanistic disciplines History Ex.: Monumenta Germaniae (or see Patrick's Sahle) Philosophy Ex.: ? Art History Ex.: digital museums? Archaeology Ex.: Silchester Jura (and Social Sciences) Ex.: Palazzolo's DB on ancient Jura Neighbours Digital Humanities and Digital Social Sciences Digital Humanities and Media Studies differences: DH: active, little scale (creation of research methods) MS: passive, big scale (observation of social phenomena) Ex.: http://lexicalist.com/ shared areas: the Digital Revolution "Hacking Academia" (active) Project fever S. Ramsay: "On building" A. Prescott: "Project fever" project vs. process application vs. research centres vs. departments DH in the Anglo-American area: research ↑ project ↑ product ↑ innovation ↓ theory ↓ teaching ↓ Centres vs. departments project/product → centres theory/teaching → departments
I temi (ovviamente tutti collegati tra di loro) di cui mi sono occupato finora durante la mia borsa sono:
Il seguente schema della mia relazione riprende i punti principali del mio lavoro elencati sopra:
- maggiore visibilità negli studi umanistici - MLA 2012: molti pannelli sulle "Digital Humanities" - istituzionalizzazione - la fase attuale (2010-2012) come momento di "istituzionalizzazione" della disciplina (nascono i dipartimenti etc.) - enti finanziatori (vari in USA e UK; l'Unione Europea e i singoli governi in Europa) - disciplinarizzazione - dibattito sullo statuto della disciplina (volumi come "Debates in the Digital Humanities", blog, conferenze etc.) - modi diversi di concepire la disciplina (strumenti da applicare? programmazione? teorizzazione?) - questioni aperte - mondo anglosassone vs. approccio europeo - sperimentare tramite progetti o teorizzare? (vd. in parte la dicotomia precedente) - le questioni messe in evidenza (in modo volutamente 'problematico', dicotomico) da Manfred Thaller nel programma del suo "Cologne Dialoque on Digital Humanities" in http://www.cceh.uni-koeln.de/events/CologneDialogue)
- (mi limiterò alla sola filologia/studi letterari digitali, escludendo archeologia, storia etc.) - grandi infrastrutture (DARIAH, Europeana, associazioni, federazioni etc.) - digitalizzazione 'di massa' (quantità): in crescita - libri (Google books etc.) - manoscritti (molti progetti) - testi (enormi archivi testuali online, spesso in TEI/XML) - livelli più sofisticati di analisi testuale: non altrettanto maturi e diffusi - algoritmi (ad es. "topic analysis" per l'analisi del testo, o le applicazioni della statistica alla distribuzione delle varianti nei MSS) - markup testuale (markup dichiarativo sulla struttura del testo, markup grammaticale, semantico etc.) - valori veicolati dall'Informatica umanistica nel mondo della ricerca umanistica - Open Source e Open Access - standard, collaborazione, riuso dei materiali - "crowdsourcing": il modello "wiki"
N.B.: non parlerò dei punti 3. e 4. seguenti.
- l'informatizzazione 'di massa' è semplice (bastano le tecnologie) - ma ci troviamo di fronte a moltissimi materiali con cui possiamo fare poco - la grande speranza degli anni '90 sulla diffusione dell'Informatica umanistica: - dare degli strumenti semplificati in mano a _tutti_ gli umanisti - un giorno tutti gli umanisti useranno strumenti digitali - e tutte le edizioni critiche saranno digitali - ad es. la TEI (lite), o alcuni software - nessuna abilità tecnico-informatica 'hard core' richiesta (ad es. saper programmare) - nessuna competenza sui _principi_ della formalizzazione (vd. Orlandi) che servirebbero per modellizzare in modo complesso prima di sperimentare - questa speranza è fallita, in quanto: - non è vero, quindici anni dopo, che tutte le edizioni critiche sono digitali - e lo stesso vale per altri ambiti di applicazione - molti progetti realizzati in passato senza una modellizzazione adeguata sono ora inutili perché - l'implementazione originaria è decaduta (software, sito web etc.) - il 'sorgente' è sotto licenza proprietaria - modellizzazione e codifica non erano adeguate - cosa deve saper fare uno studioso di Informatica umanistica? - non programmare - ma modellizzare - cioè evidenziare le questioni _umanistiche_ - porre quelle questioni in modo formale - vedere se sono formalizzabili/informatizzabili: - se è possibile - se risponde meglio a domande della ricerca umanistica - se è più conveniente (costi/benefici) - esempio: la rappresentazione digitale del testo di un manoscritto - grafemi, diasistemi, etc. - chi può fare questo? - un umanista consapevole dei principi dell'informatica - non un programmatore - né un umanista che affidi tutta la 'parte informatica' ad un 'tecnico' - il concetto di 'engineering' - tra il fisico, che ricerca i principi - e il muratore, che costruisce - c'è l'ingegnere (vd. A. Liu in http://lenz.unl.edu/papers /2011/01/11/on-building.html#comment-223113606) - l'ingegnere non costruisce case, ma crea il modello sulla base dei principi
- la tecnologia per creare tali edizioni esiste dagli anni '90 - ma non si sono fatte - la questione è: perché farle? A quale questione umanistica rispondono (meglio delle altre)? - vd. i campi in cui vengono fatte (epigrafia, testi medievali con varie versioni, varianti d'autore della letteratura contemporanea etc.) - tradizioni pluritestimoniali: vale la pena di farne edizioni critiche _digitali_? - vd. il mio post su http://www.unipa.it/paolo.monella/lincei/why.html - conclusione: cosa resta da fare al filologo digitale? - individuare questioni filologiche specifiche formalizzabili (ad es. l'edizione in preparazione di Ateneo di Aurelien Bérra: citazioni di altri testi) - chiedersi se c'è un problema nella modellizzazione (ad es. TEI/XML) delle fonti primarie (MSS etc.) - dato che abbiamo edizioni o riproduzioni di MSS - e grandi corpora testuali - ma non abbiamo il collegamento tra di essi (edizioni critiche digitali di tradizioni pluritestimoniali)