Ayuda
Ir al contenido

Dialnet


An n-gram based approach to the automatic classification of school children's writting

    1. [1] Universitat de Girona

      Universitat de Girona

      Gerona, España

    2. [2] Laboratorio AQ-Lingüistas Forenses Barcelona España
  • Localización: VIAL, Vigo international journal of applied linguistics, ISSN 1697-0381, Nº. 16, 2019, págs. 53-80
  • Idioma: inglés
  • Enlaces
  • Resumen
    • español

      Este artículo trata del análisis de la escritura de los escolares (a lo largo de la educación primaria) utilizando un conjunto de etiquetas morfológicas (n-gramas). Se han analizado un conjunto de bigramas y trigramas de un conjunto de textos literarios escritos por escolares catalanes con el objetivo de identificar qué bigramas y trigramas pueden discriminar los textos según los ciclos en los que se divide la educación primaria en España: el ciclo inicial (6 y 7 años), medio (8 y 9 años) y superior (10 y 11 años). Los resultados muestran cerca del 70% de clasificaciones correctas (el 77,5% en bigramas y el 68,6% en trigramas), lo que permite afirmar que la técnica es útil para la clasificación automática de los documentos según la edad.

    • English

      This article focuses on the analysis of schoolchildren’s writing (throughout the whole primary school period) using sets of morphological labels (n-grams). We analyzed the sets of bigrams and trigrams from a group of literary texts written by Catalan schoolchildren in order to identify which bigrams and trigrams can help discriminate between texts from the three cycles into which the Spanish primary education system is divided: lower cycle (6- and 7-year-olds), middle cycle (8- and 9-year- olds) and upper cycle (10- and 11-year-olds). The results obtained are close to 70% of correct classifications (77.5% bigrams and 68.6% trigrams), making this technique useful for automatic document classification by age.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno