Resumen de Anotación y recuperación de información semántica eventiva en corpus

Ayuda

Resumen de Anotación y recuperación de información semántica eventiva en corpus

Manuel Alcántara Plá

El presente trabajo pretende demostrar que un análisis eventivo esencial es un modo idóneo para estudiar las estructuras lingüísticas de corpus sin necesidad de limitarlos en cuanto a dominio, tipo (oral/escrito) o lengua.

Se presenta un etiquetado para corpus diseñado en XML y basado en la teoría semántica de Juan Carlos Moreno Cabrera. El conjunto de etiquetas es pretendidamente minimalista (con 16 elementos) y permite una anotación sin ambigüedades.

La viabilidad del etiquetado propuesto se muestra a través de la anotación de dos corpus con características muy diferentes. El primero, etiquetado manualmente, está formado por aprox. 50000 palabras del corpus de habla oral espontánea C-ORAL-ROM y cubre una gran variedad de dominios y registros.

El segundo, etiquetado a través del programa SST, desarrollado dentro de esta tesis, está formado por aprox. 22000 palabras del corpus periodístico UAM Spanish Treebank. SST traduce el análisis sintáctico del Treebank a estructuras eventivas.Fruto de dichos corpus, se extrae un diccionario que relaciona los lemas de los predicados etiquetados (1175 lemas) con sus tipos eventivos y, en caso de ambigüedad, con la probabilidad de que sean de uno u otro tipo.

La estructura eventiva se utiliza como base para estudiar las formas sintácticas.

De este modo, se muestran las estructuras típicas de cada parte del evento y se utilizan estas para intentar una nueva definición de las distintas clases de palabras siguiendo sólo criterios semánticos.

Finalmente, se hace un estudio de los sintagmas preposicionales para demostrar hasta qué punto la anotación semántica sirve para el análisis morfosintáctico.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Coordinado por: