Abstract

Thibault Clerice, Capitains Toolkit: un outil pour simplifier la création de corpus et l'installation de base de données CITE

La norme CTS (Canonical Text Service) est une norme d'encodage simple à intégrer dans l'élaboration d'édition de textes classiques en TEI. Sous la forme d'un fichier d'inventaire et d'une hiérarchie XML prédéfinie, elle permet de normer une édition en vue de son utilisation dans des bases de données. Depuis avril 2013, elle est utilisée par Perseus pour servir ses données à des outils internes et externes. Capitains Toolkit cherche à simplifier l'intégration d'une édition dans un réseau plus vastes d'éditeurs ouverts tels que Perseus. De la vérification de la compatibilité des éditions de chercheur-se-s à l'installation d'un service sous forme de base de données ou d'API en passant par la création automatique d'inventaire, cet outil permettra à tout-e novice de s'approprier cette norme tout en s'intégrant dans un écosystème plus large. Cet outil permet aussi de donner la capacité à tout un chacun de répliquer les services de ses éditeurs avec leurs textes – quand ils sont libres – sur un ordinateur personnel comme sur des serveurs distants, permettant une réelle décentralisation du savoir et donc une certaine émancipation quant aux difficultés techniques que peuvent rencontrer les serveurs principaux. A l'aide d’exemples de configurations fournies, les novices comme les expert-e-s pourront mettre en place des services identiques sans la moindre connaissance préalable en programmation, à travers une simple ligne de commande. Nous proposons ainsi de faire découvrir cet outil, la norme qu'il intègre et l'intérêt qu'ils représentent tous deux dans un monde d'ouverture des données.

Paolo Monella Curriculum
DH bibliography
Paolo Monella home page