La presente tesis se enmarca en el área de Procesamiento del Lenguaje Natural, y expone un amplío estudio sobre el tratamiento automático de opiniones escritas en español. El procesamiento de la opinión se puede plantear en distintos niveles, siendo el nivel de documento el que se desarrollará. Desde el punto de vista de la clasificación, se describirá un estudio de distintas métricas de ponderación de características que representan una opinión para su clasificación por un sistema de aprendizaje supervisado. También se detallará un algoritmo no supervisado basado en la extensión del significado de las palabras. Igualmente se expondrán los buenos resultados alcanzados mediante la combinación de distintos clasificadores. Además, se presentarán dos corpus de opiniones y un lexicón de opinión. Por último destacar que todas las evaluaciones se realizarán sobre textos provenientes de redes de microblogging y sobre opiniones más elaboradas procedentes de comentarios publicados en la web.
The present thesis is about the Natural Language Processing task known as Sentiment Analysis. The thesis exposes a deep study concerning the automatically treatment of opinions written in Spanish. The processing of opinions can be tackled at three levels, of which the document level was the selected one to carry out the different experiments. In the context of supervised classification, an analysis of different methods to measure the relevance of features will be described. Furthermore, an unsupervised algorithm based on the extension of the meaning of words will be exposed. Moreover, the good results reached by means the combination of dissimilar classifiers will be described. Also, two corpus of opinions and a list of opinion bearing words will be described. Finally, we have to remark that all the assessments will be done on texts from microblogging networks, and opinions from reviews web sites.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados