Gerenciando Espaço em Branco em Transcrições

2020-10-13

Em transcrições diplomáticas e editadas, o tratamento padrão do Epidoc para lidar com o espaço em branco pode não produzir os resultados desejados. Problemas ocorrem em diversas ocasiões, a mais comum sendo espaços que aparecem antes e depois de um elemento de frase. O XML trata espaço em branco de forma diferente quando ele aparece dentro de um elemento definido para conter apenas subelementos e nenhum texto livre, e elementos cuja definição permite uma mistura de texto com outros elementos. No primeiro caso, o espaço em branco em torno dos elementos contidos será ignorado. No segundo caso, espaços e retornos serão tratados como texto, e aparecerão formatados na saída como espaço único. Isto se complica devido à forma com que os editores, como o oXygen XML lidam com marcação de linhas - linhas marcadas para aumentar a legibilidade não têm espaços ou caracteres linefeed as separando, só parecem ter.

Nos exemplos abaixo, expan recebe os subelementos <abbr> e ex e também algum texto livre. No segundo caso, espaços antes ou depois dos subelementos aparecem no resultado final.

        <expan><abbr>Aug</abbr><ex>ustus</ex></expan>     

Transformation using the example EpiDoc P5 stylesheets:

  • Default (Panciera) style: Aug(ustus)
        <expan>             <abbr>Aug</abbr>             <ex>ustus</ex>         </expan>     

Transformation using the example EpiDoc P5 stylesheets:

  • Default (Panciera) style: Aug (ustus)

O exemploaseguir não terá espaços em torno de qualquer das partes da abreviação. Entretanto, se houver line feeds dentro do expan eles serão mantidos.

        <expan>Καρ<ex>ανίδι</ex></expan>     

Transformation using the example EpiDoc P5 stylesheets:

  • Duke Databank style: Καρ(ανίδι)
(DDbDP: bgu.1.154)

Se aparecerem, em um output formatado pelo Epidoc, espaços em branco onde estes não deveriam estar, a primeira coisa a fazer é verificar os arquivos fonte no XML para procurar espaços ou linefeeds que tenhamsido inseridos durante o processodecodificação, muitas vezes para melhorar a leitura.

Em alguns casos, por exemplo quando se codifica inscrições em hebraico ou arábico que usam um sistema de escrita da direita para a esquerda, é necessário usar line feeds antes das tags, para preservar a direcionalidade. Quando é importante preservar oespaço em branco exatamente como foi inserido, você deve configurar a propriedade <xsl:preserve-space> no início de seu arquivo de transformação xsl, e identificar os elementos para os quais isto se aplica. Então você pode gerencias espaço em branco explicitamente durante o processo de formatação.

Responsabilidade por esta seção

  1. Elli Mylonas, autor
  2. Gabriel Bodard, autor
  3. Assunção Medeiros, traduzido para o Português por

EpiDoc version: 9.2

Date: 2020-10-13