Ayuda
Ir al contenido

Dialnet


Corpus de textos notarials extremenys (cortenex s. XVII). L’edició d’un corpus historicolingüístic a en àmbit de les humanitats digitals

  • Autores: Inmaculada González Sopeña
  • Localización: Dialectologia, ISSN-e 2013-2247, Nº. 31, 2023, págs. 105-126
  • Idioma: catalán
  • Títulos paralelos:
    • Corpus de textos notariales extremeños (cortenex s. XVII). La edición de un corpus histórico-lingüístico en el ámbito de las humanidades digitales
    • Corpora of Notarial Texts from Extremadura (Cortenex S. XVII): Editing Historical Linguistic Corpus in the Field of Digital Humanities
  • Enlaces
  • Resumen
    • español

      El presente artículo se centra en la metodología seguida en la elaboración de un corpus de documentación notarial extremeña del siglo XVII (CORTENEX) siguiendo las propuestas del consorcio TEI en lo referente a la codificación y etiquetado de documentos históricos. Todo ello se basa en el uso de lenguaje marcado XML en las transcripciones y en el procesamiento lingüístico de los textos en la plataforma digital TEITOK a través de cuatro fases fundamentales: tokenización, normalización, lematización y anotado morfosintáctico. Este corpus se conforma con un subcorpus de Oralia diacrónica del español (ODE). Actualmente, CORTENEX ya cuenta con documentación accesible y, por el tipo de textos que incluye, su interés fundamental reside en analizar la variación léxica del español desarrollado en el territorio que se corresponde con la Comunidad Autónoma de Extremadura. Esta variedad carece prácticamente de estudios de corte diacrónico que permitan analizar la lengua de aquella región en perspectiva histórica.

    • català

      Aquest article se centra en la metodologia utilitzada en l’elaboració d'un corpus de documentació notarial extremenya del segle XVII (CORTENEX) que segueix les propostes del consorci TEI pel que fa a la codificació i l'etiquetatge de documents històrics. Es basa en l’ús de llenguatge marcat XML en les transcripcions i en el processament lingüístic dels textos en la plataforma digital TEITOK a través de quatre fases fonamentals: tokenització, normalització, lematització i anotació morfosintàctica. Aquest corpus es conforma amb un subcorpus d’Oralia diacrònica del español (ODE). Actualment, CORTENEX ja compta amb documentació accessible i, pel tipus de textos que inclou, el seu interès fonamental radica a analitzar la variació lèxica de l’espanyol usat en el territori que es correspon amb la Comunitat Autònoma d'Extremadura. Aquesta varietat no té pràcticament estudis de tall diacrònic que permetin analitzar la llengua d’aquella regió des d’una perspectiva històrica.

    • English

      This article focuses on the methodology followed in the preparation of a corpus of notarial documentation from Extremadura during the seventeenth century (CORTENEX), thanks to the proposals of the TEI consortium regarding the coding and labeling of historical documents. This is based on the use of XML markup language in the transcriptions and in the linguistic processing of the texts in the TEITOK digital platform through four fundamental phases: tokenization, normalization, stemming and morphosyntactic annotation. CORTENEX is a subcorpus of Oralia diacrónica del español (ODE). Currently, CORTENEX already has accessible documentation, and, due to the type of texts that it includes, its fundamental interest lies in analyzing the lexical variation of the Spanish developed in the territory that corresponds to Extremadura. This variety practically lacks diachronic studies that allow analyze the language of that region from a historical perspective.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno