Ayuda
Ir al contenido

Dialnet


Aplicación del factor TF-IDF en el análisis semántico de una colección documental

  • Autores: Andrés Vuotto, Celeste Bogetti, Gladys Fernández
  • Localización: Biblios: Revista electrónica de bibliotecología, archivología y museología, ISSN-e 1562-4730, Nº. 60, 2015
  • Idioma: español
  • Títulos paralelos:
    • Aplicação do fator TF-IDF na análise semântica de uma coleção documental
    • Application of TF-IDF factor in the semantic analysis of a documentary collection
  • Enlaces
  • Resumen
    • español

      Objetivo. Describe la aplicación de una herramienta para el análisis semántico de una colección documental, basada en el uso de la frecuencia de término – frecuencia inversa de documento (TF-IDF). Metodología. Se desarrolla un sistema, basado en lenguaje PHP y bases de datos MySQL, para la gestión de un tesauro, del cálculo TF-IDF (como indicador de peso semántico) y para el desarrollo de un árbol de relevancia (conformado por aquellos conceptos más relevantes del tema analizado). Se evaluó la herramienta en el análisis semántico de una colección documental de Psicología Resultados. El sistema logró identificar el nivel de presencia del tema: deontología profesional, en una colección los documentos del programa de Psicología. Conclusiones. La experiencia descrita confirma la viabilidad de la herramienta para el análisis semántico de una colección documental. Destaca la pertinencia y las capacidades de los profesionales de la información para el desarrollo de herramientas para el tratamiento de información. Los autores sugieren un especial abordaje técnico a partir del uso de scripts y de flujos de la información.

    • português

      Objetivo. Descreve a aplicação de uma ferramenta para a análise semântica de uma coleção documentária, baseada em o uso da frequência de termo – frequência inversa de documento (TF-IDF). Metodologia. Desenvolve-se um sistema, baseado em linguagem PHP e base de dados MySQL, para o gerenciamento de um tesauro, do cálculo TF-IDF (como indicador da importância semântica) e para o desenvolvimento de uma árvore de relevância (conformado por aqueles conceitos mais relevantes do tema analisado). Avaliou-se a ferramenta na análise semântica de uma coleção documentária de Psicologia. Resultados. O sistema conseguiu identificar o nível de presença do tema: deontologia profissional, em uma coleção os documentos do programa de Psicologia. Conclusões. A experiência descrita confirma a viabilidade da ferramenta para a análise semântica de uma coleção documentária. Destaca a pertinência e as capacidades dos profissionais da informação para o desenvolvimento de ferramentas para o tratamento de informação. Os autores sugerem uma especial abordagem técnica a partir do uso de scripts e de fluxos da informação.

    • English

      Objective. This paper describes the application of a tool for the semantic analysis of a document collection based on the use of term frequency–inverse document frequency (TF – IDF). Methodology. A system based on PHP and MySQL database for the management of a thesaurus, the calculation of TF – IDF (as an indicator of semantic weight) and for development a relevance tree (consisting of those concepts is developed most relevant issue analyzed). The tool was tested to the semantic analysis of a documentary collection of Psychology. Results. The system was able to identify the level of track presence: professional ethics, in a collection of documents Psychology program. Conclusions. The experience described confirms the viability of the tool for the semantic analysis of a documentary collection. It underlines the relevance and capacities of information professionals to develop this kind of tools for processing information. The authors suggests a special technical approach for use of scripts and information flows.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno