Appendix: Glossaire

2024-03-20

Crosswalk, crosswalking - Conversion
Terme générique décrivant l’acte de convertir des données depuis un modèle d’information ou de base de donnée vers un autre. Dans le cadre spécifique d’EpiDoc, le terme fait référence à la conversion des distinctions sémantiques propres à l’épigraphie ou à la papyrologie entre la définition XML EpiDoc et un ou plusieurs systèmes d’enregistrement ou de catalogage. Ces conversions peuvent se faire dans l’une ou l’autre direction, voir même, dans certains cas, dans les deux sens en parallèle de manière transparente et sans perte d’informations. Parmi les conversions les plus notables réalisées par la communauté EpiDoc on notera :
- La conversion des IRT du format XML EpiDoc au format de base de donnée de l’EDH
- La conversion du contenu de la DDbDP, de l'HGV et de l'APIS vers EpiDoc dans le cadre du projet Papiry.info (la conversion HGV-EpiDoc étant bidirectionnelle et sans perte d’informations)
- La conversion actuellement en cours des bases de donnée sous-jacentes à EAGLE vers le format XML EpiDoc dans le cadre du projet EAGLE Europeana
Encodage
Encoder signifie, dans le contexte spécifique d’EpiDoc, la transcription d’informations textuelles classiques vers un format adapté à la lecture par des systèmes informatiques, par exemple selon un standard XML.
EpiDoc Example Stylesheets (feuilles de style d’exemple EpiDoc)
Code informatique écrit en XSL ou XSLT (Extensible Stylesheet Language), et destiné à être utilisé pour convertir un fichier XML EpiDoc vers un autre format (essentiellement du texte normal ou un fichier HTML) en appliquant un certain nombre de conventions typographiques (par exemple les conventions de Leyde). La documentation et un complément d’information sont disponibles sur la page Stylesheets du Wiki EpiDoc
Schéma EpiDoc
Ensemble de règles définies de manière formelle permettant d’indiquer à un programme d’édition ou de traitement de l’XML les éléments, attributs et autres informations disponibles au sein d’un fichier EpiDoc et la manière dont ils doivent être structurés. La documentation et des informations complémentaires sont disponibles sur la page Schéma du Wiki EpiDoc
Leyde, Conventions de Leyde (Leiden)
Ensemble de règles pour la transcription de textes épigraphiques ou papyrologiques utilisant de manière simple, arbitraire et claire des symboles pour représenter les constatations et interventions éditoriales, à l’instar de ‘[‘ et ‘]’ pour indiquer un fragment perdu (restauré ou lacunaire). Il existe diverses variantes mineures de ces conventions, Krummrey-Panciera et PETRAE étant probablement les plus communes à l’heure actuelle. Un bon résumé des conventions de Leyde est disponible sur la page en.wikipedia.org/wiki/Leiden_Conventions
Leiden+ (Leyde plus)
Leiden+ est un système de balisage de texte dérivé des règles de la convention de Leyde mais incluant de nouveaux symboles et combinaisons pour, notamment, l’annotation d’apparatus complexes. Il a été initialement conçu pour l’environnement “sans balises” développé dans le cadre de l’Editeur Papyrologique. La documentation et des informations complémentaires sont disponibles sur la page papyri.info/editor/help.
Markup (Balisage - Annotation)
Les langages de balisage sont une manière de transcrire le contenu d’un texte de manière à permettre sa représentations de différentes manières et à, par exemple, rendre possible l’indexation des informations qu’il contient afin de la rendre disponible dans des index ou via des moteurs de recherche. (cf. Encodage)
Le mot “Markup” est également utilisé à l’occasion comme abréviation pour décrire la liste de diffusion Markup, système d’échanges par email destiné à communiquer au sujet d’EpiDoc et d’autres problématiques liées au balisage de textes anciens.
Morpheus
Le service d’analyse morphologique Morpheus est un outil originellement développé par le projet Perseus dont des versions sont utilisées par les projets Papyri.info et TLG pour la lemmatisation des textes grecs. La version Perseus de l’outil permet également de fournir ce service pour l’arabe et le latin. Des informations complémentaires sont disponibles sur les pages Bamboo et Perseus.
Perseus
Le projet Perseus Digital Library étudie le passage des bibliothèque physiques traditionnelles aux bibliothèques digitales et offre un nombre croissant de textes. Divers outils peuvent être utilisés directement sur le site web du projet durant la lecture, à l’instar d’un moteur de recherche, de dictionnaires ou de l’outil d’analyse morphologique Morpheus.
Pleiades
Index géographique reprenant la localisation et la toponymie de sites anciens, partant des fondations mises en place par le Barrington Atlas of the Greek and Roman World. Pleiades assigne un identifiant unique à chaque lieu, permettant de mettre en place un Web des Données (Linked Data) tel que celui maintenu par le projet Pelagios. Le projet Pleiades est accessible à l’adresse pleiades.stoa.org
TEI
Text Encoding Initiative. Ensemble de recommandations et d’outils pour l’encodage de textes littéraires et historiques en XML. C’est le format sur lequel EpiDoc se base. Les dernières recommandations sont accessibles en ligne à l’adresse http://www.tei-c.org/release/doc/tei-p5-doc/en/html/index-toc.html
World Wide Web Consortium
Le World Wide Web Consortium (W3C) est une communauté internationale développant les standards destinés à être utilisés pour Internet. Le public peut contribuer mais il existe également un personnel permanent et diverses organisations qui font partie de l’entreprise. Des informations complémentaires sont disponibles sur la page www.w3.org
XML
Extensible Markup Language. Format d’encodage textuel permettant l’encodage structuré de données ou de textes dans un format lisible tant par les machines que par l’homme. C’est la base technologique sur laquelle sont fondés tant les formats TEI et EpiDoc et forme un standard maintenu par le World Wide Web Consortium. Des informations complémentaires sont disponibles sur www.w3.org/XML.
XSLT
Extensible Stylesheet Language Transformations. XSLT est le langage informatique permettant de convertir des documents XML dans d’autres formats XML ou d’autres langages informatiques, par exemple du HTML utilisé pour créer des sites web, un format d’import d’information pour une base de données ou le format Open Document utilisé par une application de traitement de texte. Les EpiDoc Stylesheets (feuilles de style EpiDoc) sont un exemple d’XSLT utilisé pour convertir des documents XML EpiDoc vers des formats d’affichage courants. Une intéressante introduction au format XSLT est proposée par la W3 Schools

Responsables de cette section

  1. Gabriel Bodard, Auteur
  2. Laura Löser, Auteur
  3. Tom Elliott, Auteur
  4. Pascal Lemaire, Traduction française

EpiDoc version: 9.6

Date: 2024-03-20