Ayuda
Ir al contenido

Dialnet


Resumen de Alignment of un-annotated parallel texts

Galina E. Kedrova, Sergey B. Potemkim

  • español

    Se presenta un algoritmo para la alineación de los cuerpos paralelos bilingües, lingüísticamente noanotados. El algoritmo ejecuta la alineación en el nivel de oraciones mediante la utilización de un granléxico bilingüe y de las reglas heurísticas, así como de reglas gramaticales. Actualmente el sistemaefectúa la alineación de textos ingleses y rusos, sin exigir un trazado preliminar o algún otro tratamientomanual de los textos. La lematización de las palabras rusas se realiza con la utilización de undiccionario gramatical. El carácter flexible del sistema permite realizar experimentos con diversostextos literarios, científicos y jurídicos, para hallar una solución a problemas tales como la comparacióncorrecta entre una y varias oraciones, la omisión de oraciones en la traducción, o de cómo alinear apesar de las diferencias sintácticas entre dos lenguas. Las apreciaciones preliminares sonesperanzadoras y suponen un desarrollo ulterior de la técnica de alineación en el nivel de palabras ycombinaciones de palabras.

  • English

    An alignment algorithm for aligning bilingual, linguistically un-annotated parallel corpora is presented.It is able to align at sentence level, using large bilingual lexicon and heuristic cues, along withlinguistics-based rules. The system currently aligns Russian and English texts, requires no previousmark-up or other manual pre-processing of texts. Russian lemmas are obtained from the grammardictionary. The flexible nature of the system allows experiments with a variety of fiction or scientific andjuridical texts to find solutions to alignment problems like the correct alignment of one-to manysentences and omission of sentence, or how to align despite syntactic differences between two languages.First performance tests are promising, and we are going to develop further word and multiwordalignment technique.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus