Este artículo describe el sistema presentado por nuestro grupo para la tarea de análisis de sentimiento enmarcada en la campaña de evaluación TASS 2013. Adoptamos una aproximación supervisada que hace uso de conocimiento lingüístico. Este conocimiento lingüístico comprende lematización, etiquetado POS, etiquetado de palabras de polaridad, tratamiento de emoticonos y tratamiento de negación. También se lleva a cabo un preprocesado para el tratamiento de errores ortográficos. La detección de las palabras de polaridad se hace de acuerdo a un léxico de polaridad para el castellano creado en base a dos estrategias: proyección o traducción de un léxico de polaridad de inglés al castellano, y extracción de palabras divergentes entre los tuits positivos y negativos correspondientes al corpus de entrenamiento. El sistema obtiene una precisión del 60% para la detección de polaridad de alta granularidad y un 68% para baja granularidad.
This article describes the system presented for the task of sentiment analysis in the TASS 2012 evaluation campaign. We adopted a supervised approach that includes some linguistic knowledge-based processing for preparing the features. The processing comprises lemmatisation, POS tagging, tagging of polarity words, treatment of emoticons and treatment of negation. A pre-processing for treatment of spell-errors is also performed. Detection of polarity words is done according to a polarity lexicon built in two ways: projection to Spanish of an English lexicon, and extraction of divergent words of positive and negative tweets of training corpus. The system achieves an 60% accuracy fine granularity and an 68% accuracy for coarse granularity polarity detection.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados