David Birnbaum, Standardizing characters, glyphs, and SGML entities for encoding early Cyrillic writing
Abstract originale dell'articolo: The present study discusses the differences among CHARACTERS, GLPHS, and SGML ENTITIES (§2), evaluates how these distinctions might be applied to electronic text projects involving early Cyrillic materials (§3), and proposes basic inventories of the characters, glyphs, and entities needed for computer processing of early Cyrillic written materials (§4). None of the issues examined in this study is unique to early Cyrillic writing, and the principles elucidated here can be generalized to problems affecting the standardized encoding of other complex writing systems. Mie note: birnbaum1996standardizing è importante, soprattutto il paragrafo e paragrafi intorno. I paragrafi intorno indagano vari modi di codificare MSS con writing systems non stanard: codificare uno stream di caratteri (grafemi), o uno stream di glifi, o usare le entities, o usare il WSD (Writing System Declaration). Forse dice che si può inserire con un singolo keystroke (però la slide 5 di birnbaum2002future sembrerebbe dire che vada inserita un'entità \&abc;). Ma birnbaum1996standardizing dice anche che la Writing System Declaration non era allora supportata da nessun software commerciale. D'altra parte, birnbaum2002future dice che WSD così com'era non c'è più in XML, e propone alternative (bisogna cercare un articolo cartaceo di questo slideshow del 2002, perché sembra molto interessante!). Invece birnbaum2008character è tutto Unicode.
Paolo Monella Curriculum
DH bibliography
Paolo Monella home page