El conocimiento explícito de las organizaciones se encuentra recogido en colecciones documentales controladas a disposición de sus usuarios, Cuando el número de documentos es muy elevado o la tasa de incorporación de nuevos documentos a la colección es alta, se necesitan herramientas y métodos automáticos para organizar y mostrar los contenidos de la colección, que permitan y faciliten a los usuarios, no solamente encontrar la información puntural que necesitan para desarrollar sus tareas, sino tambien explorar la colección para comprender mejor su naturaleza y descubrir relaciones, patrones,tendencias, paradigmas emergentes, novedades y otras características y poder así "destilar" conocimiento nuevo.
Para ello es preciso reunir técnicas de recuperación de información y aprendizaje automático, con técnicas de agrupamiento y visualización. En la presente tesis, se muestran las técnicas empleadas y los resultados obtenidos en la construcción de un sistema de esta naturaleza.
Para estructurar la información se utiliza la clasificación automática basada en aprendizaje supervisado transductivo, que asigna categorías a los documentos de la colección a partir de un tesauro (EUROVOC) apropiado al dominio de conocimiento al que ésta pertenece. Los sintagmas más relevantes de cada documento, obtenidos mediante la aplicación de algoritmos de aprendizaje automático, permiten enriquecer la información asociada a los documentos de la colección y utilizarlos como valores de metadatos para búsquedas y también para construir resúmenes que faciliten a los usuarios determinar la relevancia de los documentos sin necesidad de leerlos. También facilitan el agrupamiento de los documentos de la colección, lo que ha sido percibido históricamente por los investigadores como una herramienta de descubrimiento ya que permite reducir la redundancia y la demanda congnitiva.
El sistema de visualización propuesto en esta tesis, permite mostrar, mediante mapas jerárquicos, el contenido completo de la colección documental, de forma que un ususario pueda explorarlo a través de la jerarquía de clases o examinando los agregados que hayan aflorado. El uso de colores representativos de la antigüedad media de los documentos en cada grupo, permite también conocer mejor su naturaleza y composición. A través del mapa puede llegarse hasta la lista de documentos que componen un grupo y elegir ahí cualquiera de ellos para ver un resumen del mismo o leer su texto completo.
Los resultados obtenidos en esta tesis demuestran la viabilidad de la construcción de una aplicación a gran escala de estas características, para integrarla en un sistema de gestión de conocimiento que tenga que manejar grandes colecciones documentales controladas.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados