El objetivo de este trabajo es explicar cómo los algoritmos lingüísticos pueden simplificar eficientemente las tareas realizadas por los lingüistas en el análisis de corpus. Para ilustrarlo, utilizaremos el corpus La Pola Siero, un conjunto de datos de un área situada en el norte de España; será el punto de partida previo al abordaje de corpus más amplios. Recopilado en 2014, se caracteriza por su naturaleza híbrida, pues incorpora textos que presentan rasgos tanto del asturiano central como del castellano. Aunque es común presentar algoritmos basados en redes neuronales, hemos optado por utilizar un clasificador bayesiano ingenuo. Esta decisión, aunque pueda considerarse algo anticuada por algunos investigadores, está justificada por varias razones: este clasificador abordará de manera efectiva la complejidad del corpus mencionado y arrojará luz sobre la relevancia y utilidad de los clasificadores bayesianos ingenuos en entornos lingüísticos específicos.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados