Ayuda
Ir al contenido

Dialnet


Inteligencia artificial y análisis de rasgos lingüísticos en corpus de textos híbridos. El caso del castellano y el asturiano

  • Autores: Cristina Bleortu, Miguel Cuevas Alonso
  • Localización: Dialectologia, ISSN-e 2013-2247, Nº. Extra 13, 2024, págs. 47-70
  • Idioma: español
  • Enlaces
  • Resumen
    • El objetivo de este trabajo es explicar cómo los algoritmos lingüísticos pueden simplificar eficientemente las tareas realizadas por los lingüistas en el análisis de corpus. Para ilustrarlo, utilizaremos el corpus La Pola Siero, un conjunto de datos de un área situada en el norte de España; será el punto de partida previo al abordaje de corpus más amplios. Recopilado en 2014, se caracteriza por su naturaleza híbrida, pues incorpora textos que presentan rasgos tanto del asturiano central como del castellano. Aunque es común presentar algoritmos basados en redes neuronales, hemos optado por utilizar un clasificador bayesiano ingenuo. Esta decisión, aunque pueda considerarse algo anticuada por algunos investigadores, está justificada por varias razones: este clasificador abordará de manera efectiva la complejidad del corpus mencionado y arrojará luz sobre la relevancia y utilidad de los clasificadores bayesianos ingenuos en entornos lingüísticos específicos.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno