Ayuda
Ir al contenido

Dialnet


Resumen de La Wikipedia como fuente multilingüe de corpus comparables

Isaac González López, Pablo Gamallo Otero

  • español

    En este artículo se describe un método automático de selección de corpus comparables a partir de laWikipedia, utilizando categorías temáticas como elementos restrictivos. Nuestra estrategia sefundamenta en dos propiedades de la Wikipedia: el ser un recurso multilingüe y el tratarse de unaenciclopedia libre disponible para descarga en formato XML. Las herramientas y los corpus generadosdispondrán de licencia libre GPL (General Public License)

  • English

    This article describes an automatic method to select comparable corpora from Wikipedia usingcategories as topic restrictions. Our strategy is based on two properties of Wikipedia: to be amultilingual resource and to be a free encyclopedia available in a XML file. Tools and corpus will bedistributed under GPL license (General Public License).


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus