Navira Gissela Angulo Murillo, Alex Alfonso Sánchez Arteaga, Gabriel Rodolfo García Murillo, Wilton Rafael Saltos Rivas
La presente investigación tiene la finalidad de elaborar un modelo de Análisis de Sentimientos de un Banco de 250 instrumentos de recolección de Datos sobre Coronavirus, mismo que es guardado como referencia en el sitio web oficial de la Organización Mundial de la Salud, OMS. Para esto se ha empleado fundamentos de Minería de Textos mediante la plataforma Open Source de Minería de Datos, Orange, construyendo un modelo que analiza el Corpus de documentos y genera diagramas de distribución de sentimientos según la herramienta Valence Aware Dictionary and Sentiment Reasoner, VADER, y nube de palabras que ilustra el peso de las palabras según su frecuencia en el Corpus. Los resultados reflejan que las emociones Neutras son las que alcanzan valores más altos en todos los tipos de preguntas, las Negativas y Positivas guardan cierto patrón y alcanzan niveles medios en todos los tipos de preguntas, en tanto que las emociones Combinadas no tienen un patrón establecido, aunque son más frecuentes en preguntas relacionadas al Entorno, Conocimiento y Tratamiento de Salud de los posibles encuestados. Es de indicar que los tipos de preguntas son siete: Entorno, Exposición, Impacto, Conocimiento, Atención médica, Percepción y Miscelánea.PALABRAS CLAVE: Big Data; Minería de Datos; Orange; Minería de Textos; Coronavirus.
MODEL FOR THE ANALYSIS OF FEELINGS OF THE SURVEY BANK WITH QUESTIONS ON WHO CORONAVIRUSES USING TEXT MINING PRINCIPLESABSTRACTThis is an academic paper, the purpose of which is to develop a Sentiment Analysis model of a Bank of 250 instruments for data collection on Coronavirus, which is kept as a reference on the official website of the World Health Organization, WHO . For this, Text Mining fundamentals have been used through the Open Source Data Mining platform, Orange, building a model that analyzes the Corpus of documents and generates diagrams of sentiment distribution according to the Valence Aware Dictionary and Sentiment Reasoner tool, VADER, and word cloud that illustrates the weight of words according to their frequency in Corpus. The results reflect that the Neutral emotions are those that reach higher values in all types of questions, the Negative and Positive ones maintain a certain pattern and reach medium levels in all types of questions, while the Combined emotions do not have an established pattern , although they are more frequent in questions related to the Environment, Knowledge and Treatment of Health of the possible respondents. It is to indicate that the types of questions are seven: Environment, Exposure, Impact, Knowledge, Medical attention, Perception and Miscellaneous.KEYWORDS: Big Data; Data Mining; Orange; Text Mining; Coronavirus.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados