Codifica per Epigrafisti, un'introduzione gentile

2024-03-20

A monte di Epidoc c'è il desiderio di mettere assieme, per gli epigrafisti, metodi e convenzioni tradizionali e moderni.

Convenzioni Epigrafiche

Durante lo scorso secolo, gli epigrafisti si sono scontrati su questioni relative alla rappresentazioni di fenomeni non verbali all'interno di un testo scritto. Fino alla fine del XIX secolo ci si aspettava dagli editori un facsimile del testo, ma ciò divenne progressivamente una pratica meno diffusa e d'altro canto gli editori non mostravano la volontà di produrre documentazione fotografica di ciascun elemento. Le convenzioni che, con difficoltà, furono messe a punto per indicare parti di testo mancanti, abbreviazioni, ecc. sono grossomodo condivise fin dagli anni '30 del XX secolo e sono simili (fino ad un certo punto), a quelle in uso in papirologia e paleografia. Tutti gli epigrafisti hanno dovuto affrontare il problema di trasportare tutto ciò in un contesto digitale - per esempio, cercando fonts che permettessero di mettere il puntino sottoscritto; molti di noi ad oggi si sono adattati a questi vincoli.

La difficoltà nel rendere questi simboli convenzionali, in particolare lettere greche, in font coerenti sul web ha ritardato le pubblicazioni dei testi epigrafici online; ma d'altro canto sono state create collezioni di testi estremamente ricche, tra le quali:

Cfr. anche: Compatibilità con EpiDoc.

Tutti questi sviluppi sono stati determinati dallo stato delle tecnologie esistenti, mano a mano che queste sono state sviluppate nel corso del XX secolo. Lo scopo di EpiDoc è di sfruttare nuove e fruttuose tecnologie per gli scopi tradizionali dell'epigrafia. Molti dei processi descritti sopra hanno coinvolto dure lotte contro gli standards tecnologici - per esempio, le pubblicazioni a stampa - per cercare di trovare un posto al maggior numero di requisiti. Durante questo periodo è stato sempre più complicato persuadere editori convenzionali ad adattarsi al nostro standard con l'inserimento di informazioni meta-testuali, se non con costi esosi. Allo stesso tempo tuttavia, le aspettative rispetto alla quantità di informazioni che accompagnano un testo è notevolmente cresciuta. Informazioni sulle caratteristiche fisiche e illustrazioni fotografiche sono diventate basilari.

Negli scorsi 15 anni gli studiosi hanno avuto in generale a che fare con requisiti simili per incorporare i loro metadati in testi in formato elettronico e sono emersi strumenti che rendono tutto ciò sempre più semplice, rendendo i risultati sempre migliori. I software per l'elaborazione di testo, che ci sono familiari sin dagli anni '80, ci permettono di controllare la formattazione dei testi, usando un mark-up che è incorporato nel software ed invisibile. I requisiti complessi di ampie raccolte di documenti - documenti legali, documentazione industriale, pubblicazioni commerciali - hanno portato negli anni '80 alla ricerca di modi di inserire un maggior numero di informazioni ed istruzioni dentro i testi. In un primo tempo l'enfasi era sull'inserimento di informazioni relative al formato, ma presto emersero metodi per includere informazioni semantiche più complesse, relative alla struttura ed al contenuto. Un esempio è quello della codifica di un titolo in quanto titolo, piuttosto che la semplice codifica del suo aspetto corsivo. L'uso di questo mark-up più astratto permette la separazione di strutture e presentazione e mentre la struttura è fondamentale per il documento, la presentazione può essere variabile e dipende dalla forma della pubblicazione. In un certo senso, questo passaggio ha rappresentato un ritorno ad una metodologia più antica, nella quale gli autori si dedicavano solo alla sostanza del testo e tutti i dettagli della presentazione erano gestiti dal processo di pubblicazione - una distinzione che si è persa solo nell'epoca della documentazione pronta per la stampa.

I protocolli emersi da quest'ultima fase sono stati standardizzati negli ultimi anni '80 come Standard Generalized Markup Language, e recentemente hanno ricevuto una struttura più semplice e flessibile, adatta all'uso sul web, con il nome di XML: Extensible Markup Language. XML è ad oggi utilizzato dagli studiosi in un numero sempre crescente di discipline umanistiche per conservare e rappresentare materiali di ricerca con diversi scopi.

I motivi per cui gli epigrafisti sono attratti da XML sono dunque molti. Per esempio: parti mancanti possono essere annotate come tali, e poi rappresentate come parentesi quadre; allo stesso tempo si possono effettuare ricerche che chiedano di cercare solo nel testo conservato, ignorando le integrazioni (quindi è possibile cercare le sole attestazioni documentate). Le lettere incerte posso essere altrettanto annotate come tali, e si possono rimandare le decisioni su come renderle, se con un puntino sottoscritto o con un altro simbolo. Le parole possono essere lemmatizzate durante l'edizione dei testi per creare indici che crescono mentre cresce la raccolta. Ciò che è ancora più importante tuttavia, a questo punto è di ripetere l'"esercizio di Leyden", cioè, mettersi d'accordo su equivalenti elettronici delle varie sigle in uso. In primo luogo, questo è importante ai fini di conservare tempo ed energie; ma anche la coerenza interna ne beneficia, senza imporre uniformità. E questo vantaggio per gli utenti non è l'unico; documenti così editi e pubblicati in formato elettronico saranno poi utilizzabili insieme, anche se sono stati preparati indipendentemente.

La necessità di standard non è propria dell'epigrafia. Fin dal 1987 un consorzio internazionale di ricercatori, soprattutto nelle discipline umanistiche ha lavorato insieme allo sviluppo e alla specifica di una serie di linee guida che descrivono le strutture e i contenuti dei documenti. I risultati di questo impegno collettivo hanno prodotto un linguaggio di codifica, realizzato in XML e descritto dal nome del gruppo - TEI, la Text Encoding Initiatve.

TEI per Epigrafisti: cos'è? E perché usarlo?

La Text Encoding Initiative è un progetto di ricerca volto alla definizione di un linguaggio di codifica che comprenda i requisiti degli studiosi di discipline umanistiche in senso molto ampio. Ci sono due scopi principali che spingono lo sviluppo di TEI. Il primo è rendere possibile agli studiosi di rappresentare i loro materiali di ricerca in formato digitale usando un linguaggio descrittivo che rispecchia le tipologie di termini analitici e di concetti che sono familiari ed essenziali alle scienze umanistiche. In secondo luogo suo scopo è rendere possibile agli studiosi di condividere i loro risultati in modo intellegibile, tramite l'uso di un linguaggio descrittivo comune.

Possiamo pensare a TEI come ad un linguaggio di codifica simile alle lingue naturali: un nucleo di termini condivisi al centro, circondati da vocabolari più specifici, che includono usi locali, terminologie specialistiche e altre variabili. Al centro di TEI ci sono dei termini comuni e dei concetti ampiamente condivisi dagli studiosi di diverse discipline: elementi come paragrafi, generiche divisioni del testo, titoli, liste, etc. elementi più specifici sono raggruppati secondo le loro applicazioni: per esempio, elementi per la codifica di nomi, elementi per la rappresentazione di caratteristiche dei manoscritti, elementi che descrivono la struttura di dizionari e così via. TEI è intenzionalmente organizzato in moduli, così che gli studiosi di determinate aree possano usare solo i moduli a cui sono interessati per i loro lavori, omettendo gli altri. TEI può dunque raggiungere molti, senza oberare nessuno con una massa di informazioni importanti solo per altre discipline. Al contrario, TEI può essere adattato a scopi molto specifici e può essere limitato a ciò che è strettamente necessario per ciascun lavoro.

Come in una lingua naturale, TEI può essere usato in qualsiasi modo, purché basato su un vocabolario ricco e specifico, con una codifica dettagliata in grado di descrivere moltissimi fenomeni testuali, ma che può anche essere usata in modo molto semplice, con pochi concetti essenziali che descrivono solo gli elementi testuali di base: sezioni, titoli, paragrafi. Più dettagliata è la codifica, più è possibile fare con i testi codificati, ma fattori quali i tempi, i costi, il personale e le competenze locali possono limitare il livello di dettagli possibile.

In aggiunta a fornire un sistema di codifica che gli studiosi possono usare nella sua forma originale, TEI offre ai progetti di ricerca anche modi per definire versioni adattate di TEI, che includono modifiche necessaria per supportare requisiti specifici. Dato che queste versioni derivate operano all'interno del contesto TEI, possono servirsi dei suoi termini e concetti fondamentali, evitando il lavoro di re-inventarli. Inoltre, dato che TEI offre un modo per descrivere questi adattamenti, questi stessi possono essere significativamente condivisi. Ne risulta che gruppi di studiosi di particolari discipline possono articolare i loro obiettivi e metodi così come le differenze esistenti da altri che lavorano nel medesimo settore. Invece che sistemi mutualmente incomprensibili, progetti diversi possono così produrre risultati le cui differenze sono date da fondamentali discrepanze non da mere divergenze.

La specifica di EpiDoc: TEI per epigrafisti

All'interno di questo contesto, la comunità di EpiDoc community lavora fin dal 2000 allo sviluppo di una versione adattata delle linee guida della TEI, dedicate ai bisogni specifici degli epigrafisti. L'idea fu lanciata da Tom Elliott, uno storico antichista dell'University of North Carolina a Chapel Hill; lo scopo è sia di sfruttare al massimo il lavoro già fatto, sia di assicurare il fatto che testi iscritti siano trattati in modo coerente con quello di cui ci si serve per altri tipi di testo, e non in modo dissimile. La specifica di EpiDoc elimina elementi irrilevanti dal corpo principale di TEI e aggiunge elementi per gli specifici tipi di trascrizione, analisi, descrizione e classificazione che sono essenziali al lavoro epigrafico. Il risultato è un linguaggio semplice ma capace di codificare tutti gli aspetti significativi di un'iscrizione insieme a tutte le informazioni che accompagnano l'oggetto in sé.

Per complementare EpiDoc come linguaggio di codifica, la comunità di EpiDoc ha prodotto anche un set di linee guida e di strumenti software, nonché la relativa documentazione che descrive come usare i linguaggi di codifica, gli strumenti e gli altri elementi del metodo EpiDoc. L'obiettivo è stabilire un contesto che sia facile da imparare ed usare, anche per studiosi che non abbiano competenze o supporto tecnico. Può sembrare improbabile ma l'impresa è dello stesso tipo di quella che si intraprende imparando a fare la normale edizione di un testo epigrafico usando le sigle in uso.

Il gruppo ha lavorato allo sviluppo di espressioni adatte per ciascuna delle convenzioni epigrafiche in uso ed ha anche esteso le linee guida per affrontare i vari campi presenti in un pubblicazione epigrafica, quali:

Vedi anche: Struttura del Documento.

Ulteriori aree di ricerca includono l'interoperabilità. Esiste un software per convertire normali testi in EpiDoc XML, chiamato Chapel Hill Electronic Text Converter (CHETC). Altre aree includono l'uso di lessici di riferimento. Per esempio il progetto Inscriptions of Aphrodisias sta lavorando a stretto contatto con il Lexicon of Greek Personal Names, per garantirne la copertura completa e l'uso coerente.

Il lavoro, diretto dal Dr. Elliott, è stato portato avanti da diversi studiosi che hanno lavorato in stretta collaborazione, e con regolari contatti con gli epigrafisti latu sensu. Si sono basati sull'esperienza di un progetto EpiDoc ben stabilito Vindolanda Tablets on line, e su due progetti in corso: the US Epigraphy Project (USEP) (sostenuto da Brown, Princeton e Rutgers Universities), e il progetto Inscriptions of Aphrodisias (InsAph) (finanziato dall'Arts and Humanities Research Council). Il generoso supporto dell'AHRC ha anche permesso di organizzare workshop intensivi in Marzo 2006 dove le linee guida sono state perfezionate.

Responsabilità per questa sezione

  1. Charlotte Roueché, autore
  2. Julia Flanders, autore
  3. Pietro Maria Liuzzo, traduzione italiana
  4. Greta Franzini, correzione traduzione italiana
  5. Tom Elliott, coerced from TEI-Lite and various reformatting edits
  6. Gabriel Bodard, re-encoded and updated links

EpiDoc version: 9.6

Date: 2024-03-20