Línguas e escritas

2024-03-20

TEI/EpiDoc fornecem mecanismos para a codificação de linguagens e sistemas de escrita, da relação destes com o conteúdo de um arquivo EpiDoc e com o texto descrito e transcrito dentro do arquivo. Ao fazer isto, utilizamos os padrões de Internet para a identificação destas linguagens e escritas. Esta parte das Normas trata de todos os aspectos relevantes.

Elemento relevante de documentação (TEI):

Forma de indicar as línguas e escritas utilizadas em um arquivo EpiDoc

TEI e EpiDoc seguem as melhores práticas em uso, delineadas no Network Working Group's RFC 5646: Tags for Identifying Languages, que estabelece as normas para isto em toda a Internet. O RFC e seus documentos de suporte definem uma sintaxe para a criação de cadeias curtas de caracteres (‘language tags’) que funcionam como identificadores únicos para qualquer combinação desejada de lingua e escrita. Estas tags são compostas de ‘subtags’ para línguas enquanto língua, sistema de escrita e variações regionais e de dialeto. O RFC também estabelece um processo de registro e manutenção destas subtags através da Internet Assigned Numbers Authority.

Um arquivo EpiDoc válido deve utilizar as subtags registradas no IANA Language Subtag Registry. Muitos criadores de EpiDoc já dever estar familiarizados com alguns destes códigos, vistos em outros projetos digitais, como por exemplo:

  • Grek = escrita grega
  • Latn = escrita latina
  • en = língua inglesa (presumida como apresentada em sua escrita padrão: Latn)
  • fr = língua francesa (presumida como apresentada em sua escrita padrão: Latn)
  • el = língua grega moderna (1453-; presumida como apresentada em sua escrita padrão: Grek)
  • grc = língua grega antiga (to 1453; presumida como apresentada em sua escrita padrão: Grek)
  • grc-Latn = língua grega antiga (to 1453), escrita em caracteres latinos

Quando o registro do IANA não fornece códigos apropriados, um projeto EpiDoc pode criar "subtags de uso privado", desde que elas sejam definidas internacionalmente no arquivo EpiDoc como descrito no parágrafo a seguir e desde que elas estejam em conformação sintática com as especificações descritas no RFC 5646, seções 2.1: Syntax e 4.6: Considerations for Private Use Subtags. Por exemplo, a equipe das Inscrições Campā verificou que as duas subtags de língua cham (cja = cham ocidental e cjm = cham oriental) e a subtag de escrita associada a elas (Cham) eram bastante diferentes da língua cham antiga e da escrita representada nas inscrições. Portanto, o uso privado da subtag "x-oldcam-latn-ci" foi inventado e recebeu um significado específico para o projeto "língua cam antiga em escrita cam antiga, transcrita em caracteres latinos". Sempre que possível os projetos e adeptos do EpiDoc devem assumir a tarefa de registrar novas subtags no IANA, para benefício de outros. O procedimento para fazer isto está descrito no RFC 5646 Section 3.5.

Describe langUsage here.

<langUsage>
 <language ident="ar">Arabic</language>
 <language ident="cop">Coptic</language>
 <language ident="egy-Egyd">Egyptian in Demotic script</language>
 <language ident="egy-Egyh">Egyptian in Hieratic script</language>
 <language ident="egy-Egyp">Egyptian Hieroglyphic</language>
 <language ident="etr">Etruscan</language>
 <language ident="el">Modern Greek</language>
 <language ident="grc">Ancient Greek</language>
 <language ident="grc-Latn">Ancient Greek written in latin script</language>
 <language ident="he">Hebrew</language>
 <language ident="la">Latin</language>
 <language ident="la-Grek">Latin written in Greek script</language>
</langUsage>

Codificação de caracteres e fontes

Indicação da língua e escrita moderna utilizada em todo o arquivo EpiDoc

Sinalização de línguas e escritas usadas em textos e nas traduções apresentadas

<textLang mainLang="grc"
 otherLangs="grc-Latn la">
Inscription in ancient Greek with
some words transcribed in Latin characters, and later annotation in Latin.
</textLang>

Marcação de transições de língua ou escrita no texto

tba

See also:

Other pages describing <langUsage>:

    Other pages describing <language>:

      Other pages describing <textLang>:

        Other pages describing <foreign>:

        Responsabilidade por esta seção

        1. Gabriel Bodard, autor
        2. Tom Elliott, autor
        3. Assunção Medeiros, traduzido para o Português por

        EpiDoc version: 9.6

        Date: 2024-03-20