Ayuda
Ir al contenido

Dialnet


Resumen de Paralelización del corpus sensem: español-catalán

Glòria Vázquez García, Ana María Fernández Montraveta

  • español

    En ese trabajo presentamos un corpus paralelo para las lenguas española y catalana, SenSem. Se trata de un corpus paralelo anotado a distintos niveles lingüísticos (morfológico, sintáctico y semántico) y que abarca distintas unidades de información (palabra, sintagma y oración). Uno de los valores principales de este recurso es que ha supuesto la creación del primer corpus del catalán con información relativa a aspectos de la semántica oracional, como la aspectualidad y la modalidad. El recurso se ha creado traduciendo al catalán el corpus ya creado para el español en un proyecto anterior y manteniendo los vínculos entre ambas lenguas entre las distintas unidades de información mencionadas. Además, se ha heredado la anotación que se llevó a cabo para el español, corrigiendo cuando ha sido necesario la información para el catalán.

  • English

    This paper presents a parallel corpus for Spanish and Catalan, SenSem. The parallel corpus has been annotated at several linguistic levels (morphological, syntactical and semantic). The information covered at the different levels ranges from words to phrases, and sentences. One of the main values of the resource presented in this work is that it is the first corpus for Catalan that has been annotated with information regarding sentence semantics such as aspectuality and modality. The methodology followed in this project was to translate into Catalan the corpus we already had available from a previous project in Spanish. The link between both corpora has been established at the different informative units mentioned above. All the linguistic annotation has been inherited, correcting necessary aspects when it proved necessary.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus