Los sistemas de extracción de información necesitan un procesamiento previo que reconozca, entre otras cosas, elementos correferenciales tales como las variantes de nombres propios. El presente artículo tiene dos objetivos: por un lado, describe los principales tipos de correferencia de nombres de persona encontrados en textos enciclopédicos y periodísticos en castellano. Por otro lado, presenta un algoritmo que resuelve satisfactoriamente la mayor parte de los casos descritos. El sistema, que no necesita corpus de entrenamiento, permite unificar las variantes de nombres de persona que aparecen en un texto, mejorando así tareas como la extracción de información biográfica.
Information extraction systems need a previous processing step in order to recognize coreferential elements, such as personal name variants. This paper has two aims: the first is to describe the main types of personal name coreference found in encyclopedic and journalistic texts in Spanish. Furthermore, we introduce an algorithm that solves most coreferential links between personal name variants succesfully. The system, which does not need a training corpus, unifies the coreferential elements found in a text, thereby improving tasks like biographical information extraction.
© 2001-2025 Fundación Dialnet · Todos los derechos reservados