Ayuda
Ir al contenido

Dialnet


Resumen de Construcción de un corrector ortográfico híbrido para el chabacano de Zamboanga

Marcelo Yuji Himoro, Antonio Pareja Lora

  • español

    El chabacano zamboangueño es una variedad de criollo español hablada en la ciudad de Zamboanga, Filipinas. Dadas (a) la naturaleza mixta de la lengua, que engloba principalmente elementos del castellano, de las lenguas visayas, del tagalo y del inglés, y (b) su peculiar ortografía de orientación etimológica, los hablantes se ven obligados a manejar diferentes sistemas de escritura. Las variadas grafías prenormativas y los fenómenos de cambio y mezcla de código son también una barrera para la detección y la corrección automática de los errores ortográficos.

    Este trabajo propone el desarrollo de un corrector ortográfico escalable, interoperable y capaz de dar respuesta al problema ortográfico del zamboangueño.

    Los resultados demuestran que es viable el uso de Hunspell, la tecnología de corrección ortográfica actual por defecto, por medio de su combinación con técnicas de aprendizaje automático y la incorporación de datos del tagalo y del inglés.

  • English

    Zamboanga Chavacano is a variety of Philippine Creole Spanish spoken mainly in Zamboanga City. Based mostly on Spanish with elements of Visayan, Tagalog and English origins, its mixed nature and peculiar etymology-based orthography forces speakers to deal with different writing systems in order to be able to correctly write the language. The diversity found in the (still in use) non-standard writing systems and the omnipresence of code-switching and code-mixing phenomena are a further challenge for automated spelling error detection and correction. This research aims to develop a scalable and interoperable spell checker, capable of handling the Zamboangueño orthographic problem. Our results show that it is possible to raise the de facto standard spell checker Hunspell performance to acceptable precision levels, by combining it with machine learning techniques and incorporating Tagalog and English data in its processing. Such a spell checker would also allow users to indirectly familiarize with the orthography.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus