Esta comunicación describe la generación automática y la evaluación de conjuntos de reglas para la desambiguación del sentido de las palabras (DSP) en la traducción automática. El objetivo principal es identificar reglas de alta calidad que se pueden utilizar como fuentes del conocimiento en un modelo relacional de DSP. La evaluación fue realizada automáticamente, por medio de cuatro medidas objetivas (error, cobertura, suporte y novedad), y manualmente, por medio de un análisis subjetivo del nivel del interés de las mejores reglas según lo precisado por las medidas objetivas. Han sido seleccionadas 63 reglas que trataban siete verbos altamente ambiguos. La evaluación también evidenció qué clases de conocimiento fueron utilizadas con eficacia por las reglas de DSP, que no son siempre iguales aquéllas reveladas por evaluaciones tradicionales de los modelos completos de DSP. Aunque hayamos realizado experimentos con inglés-portugués, los procedimientos de generación y evaluación de las reglas se podrían aplicar a cualquier par de lenguas, siempre que un corpus de ejemplos de desambiguación esté disponible para este par de lenguas
This paper describes the automatic generation and the evaluation of sets of rules for word sense disambiguation (WSD) in machine translation. The ultimate aim is to identify high-quality rules that can be used as knowledge sources in a relational WSD model. The evaluation was carried out both automatically, by means of four objective measures (error, coverage, support and novelty), and manually, by means of a subjective analysis of the level of interest of the best rules as pointed out by the objective measures. As a result, we selected 63 rules addressing seven highly ambiguous verbs. The evaluation also evidenced which kinds of knowledge were effectively used by the WSD rules, which are not always the same as those evealed by traditional evaluations of complete WSD models. Although we experimented with English-Portuguese, the rule generation and evaluation procedures could be applied to any language pair, provided that there is a disambiguation sample corpus for that language pair
© 2001-2024 Fundación Dialnet · Todos los derechos reservados