Ayuda
Ir al contenido

Dialnet


Universal dependencies of old English. Automatic parsing with a computational model of language

  • Autores: Sara Domínguez Barragán
  • Directores de la Tesis: Francisco Javier Martín Arista (dir. tes.), Ana Elvira Ojanguren López (dir. tes.)
  • Lectura: En la Universidad de La Rioja ( España ) en 2024
  • Idioma: inglés
  • Número de páginas: 374
  • Títulos paralelos:
    • Dependencias universales del inglés antiguo. Anotación sintáctica automática con un modelo de lenguaje computacional
  • Tribunal Calificador de la Tesis: María Luisa Carrió Pastor (presid.), Juan Antonio Cutillas Espinosa (secret.)
  • Materias:
  • Enlaces
    • Tesis en acceso abierto en: Dialnet
  • Resumen
    • español

      Esta tesis se inscribe en los ámbitos de la lingüística histórica, la lingüística de corpus y el procesamiento del lenguaje natural. Para ser más precisos, se centra en la morfología y la sintaxis del inglés antiguo y pretende evaluar la precisión de un modelo automático de anotación del inglés antiguo que aplica el marco de las Dependencias Universales (de Marneffe et al. 2021). Para ello, se ha anotado manualmente un corpus de 25.000 palabras (corpus de oro) con los conjuntos de etiquetas del corpus paralelo inglés contemporáneo-inglés antiguo ParCorOEv2 (Martín Arista et al. 2021). A continuación, el conjunto de datos y el conjunto de etiquetas del corpus de oro se han adaptado para ajustarse a los requisitos de Dependencias Universales en términos de tokenización, anotación morfológica, anotación sintáctica y formato CoNLL-U. Al mismo tiempo, el conjunto de datos en bruto se ha anotado automáticamente y el resultado de la anotación automática se ha comparado con los resultados de la anotación manual. Esta comparación se refiere tanto al método como a la propia anotación. En cuanto al método, se ha evaluado y comparado con una publicación reciente, respecto a la cual este enfoque muestra una mayor precisión y un mejor rendimiento en términos generales. En cuanto a la anotación, se han identificado las principales áreas de error de la asignación automática de rasgos morfológicos, categorías gramaticales y funciones sintácticas. Las principales conclusiones de esta investigación apuntan a las limitaciones del modelo en cuanto a su rendimiento en la tarea de anotación automática del inglés antiguo y las Dependencias Universales, al tiempo que aportan algunas soluciones para abordar dichas limitaciones.

    • English

      This thesis falls within the fields of Historical Linguistics, Corpus Linguistics and Natural Language Processing. To be more precise, it deals with Old English morphology and syntax and aims at assessing the accuracy of an automated model of annotation of Old English that applies the framework of Universal Dependencies (de Marneffe et al. 2021). To do so, a golden corpus of 25,000 words has been annotated manually with the tagsets of the Old English-Present-Day English parallel corpus ParCorOEv2 (Martín Arista et al. 2021). Then, the dataset and the tagset from the golden corpus have been adapted to conform to the requirements of Universal Dependencies in terms of tokenization, morphological annotation, syntactic annotation and CoNLL-U format. At the same time, the raw dataset has been annotated automatically and the outcome of automatic annotation has been compared with the results of manual annotation. Such comparison involves both the method and the annotation itself. As for the method, it has been assessed and compared with a recent publication, with respect to which this approach shows higher accuracy and better performance in general terms. As regards the annotation, the main areas of error of the automatic assignment of features, categories and functions have been identified. The main conclusions of this research point to the limitations of the model as to its performance in the task of automatic annotation of Old English with Universal Dependencies, while providing some suitable solutions to address these limitations.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno