Ayuda
Ir al contenido

Dialnet


Resumen de Desarrollo de un sistema de asignación automática de lenguaje controlado a partir de palabras clave

Antonio Eleazar Serrano López, Carmen Martín

  • español

    Con el objetivo de hacer frente a la limitación, que suelen presentar las bases de datos bibliográficas, respecto a la asignación temática, se presenta el actual desarrollo de un sistema automatizado para la asignación de términos de un lenguaje controlado, en este caso el Medical Subject Headings (MeSH) a registros bibliográficos obtenidos de una base de datos multidisciplinar, como es la Web of Science. El sistema se basa en la asignación de los términos a partir de la comparación de las palabras clave con los términos del lenguaje controlado, por medio del metatesauro Unified Medical Language System (UMLS), de forma que se asignen los términos aceptados, que se correspondan con las palabras clave. El sistema se complementa con el uso de algoritmos de similaridad, basados en n-grams, con la finalidad de resolver posibles errores tipográficos y/o ortográficos en las palabras clave. En el entorno de pruebas, formado por una base de 19.415 documentos, obtenidos de la Web of Science, el sistema fue capaz de asignar términos del lenguaje controlado a 15.025 de ellos, consiguiendo una eficacia del 77,39%, y describiendo de forma mucho más completa, el contenido de los documentos.

  • English

    With the objective of break the limitation, which often present bibliographic databases, with respect to thesubjects assignment, is presented this development of an automated system for the assignment of terms ofa controlled language, in this case the Medical Subject Headings (MeSH) to bibliographic records, obtainedfrom a multidisciplinary database, such as the Web of Science. The system is based on the assignment of theterms from the comparison of keywords with language controlled terms by metathesaurus Unified MedicalLanguage System (UMLS), so it maps the accepted terms, corresponding to the keywords. The system iscomplemented by the use of similarity algorithms, using n-grams, in order to resolve any typographicaland/or spelling mistakes in the keywords. In the test environment, consisting of a database 19,415 documentsobtained from the Web of Science, the system was able to assign controlled vocabulary terms to 15,025 ofthem, achieving an efficiency of 77.39%, and describing in a more complete way, the content of documents.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus