Ayuda
Ir al contenido

Dialnet


A Method to Lexical Normalisation of Tweets

    1. [1] Universidade de Santiago de Compostela

      Universidade de Santiago de Compostela

      Santiago de Compostela, España

    2. [2] Imaxin Software
  • Localización: XXIX Congreso de la Sociedad Española de Procesamiento de Lenguaje Natural: SEPLN 2013 / coord. por Alberto Díaz Esteban, Iñaki Alegría Loinaz, Julio Villena Román, 2013, ISBN 978-84-695-8349-4, págs. 81-85
  • Idioma: español
  • Títulos paralelos:
    • Un método de normalización léxica de tweets
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • español

      Este artículo describe una estrategia de normalización léxica de palabras “out-of-vocabulary” (OOV) en tweets escritos en español. Para corregir OOV incorrectos, el sistema de normalización genera candidatos “in-vocabulary” (IV) que aparecen en diferentes recursos léxicos y selecciona el más adecuado. Nuestro método genera dos tipos de candidatos, primarios y secundarios, que serán ordenados de diferentes maneras en el proceso de selección del mejor candidato.

    • English

      This paper describes a strategy to perform lexical normalisation of out- of-vocabulary (OOV) words in Spanish tweets. To correct any ill-formed OOV, the normalisation system generates in-vocabulary (IV) candidates found in several lexical resources, and selects the best one. Our method generates two types of candidates, primary and secondary IV candidates, which will be ranked in different ways to select the best candidate.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno