Ayuda
Ir al contenido

Dialnet


Experimentos de extracción terminológica orientados a la construcción de un tesauro de bibliotecologia

    1. [1] Universidad Nacional Autónoma de México

      Universidad Nacional Autónoma de México

      México

  • Localización: Biblios: Revista electrónica de bibliotecología, archivología y museología, ISSN-e 1562-4730, Nº. 83, 2021, págs. 39-56
  • Idioma: español
  • Títulos paralelos:
    • Experiência de extração de terminologia orientada para a construção de um thesaurus de biblioteconomia
    • Experiment of terminology extraction oriented to the construction of a library science thesaurus
  • Enlaces
  • Resumen
    • español

      Objetivo. Evaluar dos técnicas de extracción terminológica: extracción terminológica manual y extracción terminológica automatizada, para analizar la efectividad de cada proceso en la obtención de términos útiles para la construcción de un tesauro de bibliotecología.Metodo. La metodología empleada fue exploratoria-cuantitativa y se fundamentó en dos experimentos de extracción terminológica: (1) extracción manual y (2) extracción automatizada. El proceso de extracción terminológica manual fue llevado a cabo por un profesional con formación académica multidisciplinaria mientras que en la extracción terminológica automatizada se empleó el programa WordStat. Tanto en el  proceso de extracción manual como automatizada se partió del mismo corpus, formado por 283,585 palabras que corresponden a 59 artículos de la especialidad publicados en la revista Investigación Bibliotecológica durante los años 2019 y 2020.Resultados. Los resultados muestran que:  la extracción terminológica manual implicó una cantidad considerable de tiempo humano de dedicación pero el 82% de los términos resultaron útiles y fueron establecidos como descritores viables para el tesauro. En comparación la extracción terminológica automatizada fue un proceso que implicó menor tiempo, pero sólo el 12% de los términos resultaron útiles y fueron establecidos como descriptores viables para el tesauro.Conclusiones. Se encontró que cada una de las técnicas de obtención terminológica resultó útil, pero presentaron diferencias. Mientras la extracción manual implicó un nivel alto de recursos humanos y tiempo, sus resultados se observaron excelentes. En contraste, la extracción automatizada requirió menor inversión humana y tiempo, pero la cantidad de términos útiles también fue menor. Se concluye que la experimentación con diversas técnicas de extracción terminológica es importante, asociada a la base terminológica que constituye el pilar de todo vocabulario controlado.

    • English

      Objective. The objective of this artcicle is to evaluate two terminology extraction techniques: manual terminology extraction and automated terminology extraction, to assess the effectiveness of each process in obtaining useful terms for the construction of a library thesaurus.Method. The methodology used was exploratory-quantitative and was based on two terminology extraction experiments: (1) manual extraction and (2) automated extraction. The manual terminology extraction process was carried out by a professional with multidisciplinary academic training, while the automated terminology extraction process was carried out using WordStat program. Both, manual and automated extraction processes were based on the same corpus, consisting of 283,585 words corresponding to 59 articles about library and information science that were published in the journal Investigación Bibliotecológica during the years 2019 and 2020.Results. The results show that: manual terminology extraction provided excellent results, 82% of the terms were useful and were established as viable descriptors for the thesaurus. In comparison, automated extraction was a time-consuming process, but only 12% of the terms proved useful and were established as viable descriptors for the thesaurus.Conclusions. It was found that each of the terminology retrieval techniques was useful but presented differences. While manual extraction required a high investment of human resources and time, its results also showed high effectiveness. In contrast, automated extraction required less human investment and was fast in time, but its results in this experiment were less accurate and useful. It is concluded that experimentation with various terminology extraction techniques is important, associated with the terminology base that is the cornerstone of any controlled vocabulary.

    • português

      Objetivo. O objetivo desta arte é avaliar duas técnicas de extração de terminologia: extração manual e extração automatizada, para avaliar a eficácia de cada processo na obtenção de termos úteis para a construção de um thesaurus de biblioteconomia.Método. A metodologia utilizada foi exploratória-quantitativa e foi baseada em duas experiências de extração de terminologia: (1) extração manual e (2) extração automatizada. O processo de extração de terminologia manual foi realizado por um profissional com treinamento acadêmico multidisciplinar, enquanto o processo de extração de terminologia automatizada foi realizado utilizando o programa WordStat. Tanto o processo de extração manual quanto o automatizado foram baseados no mesmo corpus, consistindo de 283.585 palavras correspondentes a 59 artigos sobre biblioteca e ciência da informação que foram publicados na revista Investigación Bibliotecológica durante os anos de 2019 e 2020.Resultados. Os resultados mostram que: a extração manual da terminologia forneceu excelentes resultados, 82% dos termos foram úteis e foram estabelecidos como descritores viáveis para o thesaurus. Em comparação, a extração automatizada foi um processo demorado, mas apenas 12% dos termos se mostraram úteis e foram estabelecidos como descritores viáveis para o thesaurus.Conclusões. Constatou-se que cada uma das técnicas de recuperação terminológica foi útil, mas apresentou diferenças. Embora a extração manual exigisse um alto investimento de recursos humanos e tempo, seus resultados também mostraram alta eficácia. Em contraste, a extração automatizada exigiu menos investimento humano e foi rápida no tempo, mas seus resultados nesta experiência foram menos precisos e úteis. Conclui-se que a experimentação com várias técnicas de extração terminológica é importante, associada à base terminológica que é a pedra angular de qualquer vocabulário controlado.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno