Minería de texto en la clasificación de documentos digitales

Marcial Contreras Barrera

Ayuda

Minería de texto en la clasificación de documentos digitales

Autores: Marcial Contreras Barrera
Localización: Biblios: Revista electrónica de bibliotecología, archivología y museología, ISSN-e 1562-4730, Nº. 64, 2016
Idioma: español
Títulos paralelos:
- Mineração de texto em a classificação de documentos digitais
- Text mining in the classification of digital documents
Enlaces
- Texto completo (pdf)

Dialnet Métricas: 2 Citas

Resumen
- español
  Objetivo: Desarrollar un clasificador automatizado para la clasificación de material bibliográfico por medio de la minería de texto. Metodología: La minería de texto es empleada para el desarrollo del clasificador, basado en un método de tipo supervisado conformado por dos etapas; de aprendizaje y reconocimiento, en la etapa de aprendizaje, el clasificador aprende patrones a través del análisis de registros bibliográficos, de la clasificación Z, del área de bibliotecología, ciencias de la información y recursos de información recuperados de la base de datos LIBRUNAM , en esta etapa se obtiene el clasificador capaz de reconocer diferentes subclases (LC). En la etapa de reconocimiento el clasificador se valida y evalúa a través de pruebas de clasificación, para este fin se toman aleatoriamente registros bibliográficos de la clasificación Z, clasificados por un catalogador y procesados por el clasificador automatizado, con el fin de obtener la precisión del clasificador automatizado. Resultados: La utilización de la minería de texto permitió el desarrollo del clasificador automatizado, a través del método de clasificación de documentos de tipo supervisado. La precisión del clasificador fue calculada realizando la comparación entre los temas asignados de manera manual y automatizada obteniendo un grado de precisión del 75.70%. Conclusiones: La aplicación de la minería de texto facilito la creación del clasificador automatizado, permitiendo obtener tecnología útil para la clasificación de material bibliográfico con la finalidad de mejorar y agilizar el proceso de organización de información.
- English
  Objective: Develop an automated classifier for the classification of bibliographic material by means of the text mining. Methodology: The text mining is used for the development of the classifier, based on a method of type supervised, conformed by two phases; learning and recognition, in the learning phase, the classifier learns patterns across the analysis of bibliographical records, of the classification Z, belonging to library science, information sciences and information resources, recovered from the database LIBRUNAM, in this phase is obtained the classifier capable of recognizing different subclasses (LC). In the recognition phase the classifier is validated and evaluates across classification tests, for this end bibliographical records of the classification Z are taken randomly, classified by a cataloguer and processed by the automated classifier, in order to obtain the precision of the automated classifier. Results: The application of the text mining achieved the development of the automated classifier, through the method classifying documents supervised type. The precision of the classifier was calculated doing the comparison among the assigned topics manually and automated obtaining 75.70% of precision. Conclusions: The application of text mining facilitated the creation of automated classifier, allowing to obtain useful technology for the classification of bibliographical material with the aim of improving and speed up the process of organizing digital documents.
- português
  Objetivo: Desenvolver um classificador automatizado para a classificação de material bibliográfico por meio da mineração de texto. Metodologia: A mineração de texto é empregue para o desenvolvimento do classificador, baseado num método de controle conformado por duas etapas; de aprendizagem e reconhecimento, na etapa de aprendizagem, o classificador aprende padrões através da análise de registros bibliográficos, da classificação Z, da área da biblioteconomia, as ciências da informação e recursos de informação recuperados da base de dados LIBRUNAM , nesta etapa se obtém o classificador com capacidade de reconhecer as diferentes subclases (LC). Na etapa de reconhecimento o classificador se valida e avalia mediante provas de classificação, para issp se tomam aleatoriamente registros bibliográficos da classificação Z, classificados por um catalogador e processados pelo classificador automatizado, com o fim de obter a precisão do classificador automatizado. Resultados: A utilização da mineração de texto permitiu o desenvolvimento do classificador automatizado, mediante o método de classificação de documentos de forma controlada. A precisão do classificador foi calculada realizando a comparação entre os temas atribuídos de forma manual e automatizada obtendo um grau de precisão de 75.70%. Conclusões: A aplicação da mineração de texto facilitou a criação do classificador automatizado, permitindo obter tecnologia útil para a classificação de material bibliográfico com a finalidade de melhorar e agilizar o processo de organização da informação.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: