Isaac González López, Pablo Gamallo Otero
En este artículo se describe un método automático de selección de corpus comparables a partir de laWikipedia, utilizando categorías temáticas como elementos restrictivos. Nuestra estrategia sefundamenta en dos propiedades de la Wikipedia: el ser un recurso multilingüe y el tratarse de unaenciclopedia libre disponible para descarga en formato XML. Las herramientas y los corpus generadosdispondrán de licencia libre GPL (General Public License)
This article describes an automatic method to select comparable corpora from Wikipedia usingcategories as topic restrictions. Our strategy is based on two properties of Wikipedia: to be amultilingual resource and to be a free encyclopedia available in a XML file. Tools and corpus will bedistributed under GPL license (General Public License).
© 2001-2024 Fundación Dialnet · Todos los derechos reservados