Ayuda
Ir al contenido

Dialnet


La Wikipedia como fuente multilingüe de corpus comparables

    1. [1] Universidade de Santiago de Compostela

      Universidade de Santiago de Compostela

      Santiago de Compostela, España

  • Localización: Language Windowing through Corpora / coord. por Isabel Moskowich, Begoña Crespo, Inés Lareo Martín, Paula Lojo Sandino, Vol. 1, 2010 (Part I, A-K), ISBN 978-84-9749-401-4, págs. 369-378
  • Idioma: gallego
  • Enlaces
  • Resumen
    • español

      En este artículo se describe un método automático de selección de corpus comparables a partir de laWikipedia, utilizando categorías temáticas como elementos restrictivos. Nuestra estrategia sefundamenta en dos propiedades de la Wikipedia: el ser un recurso multilingüe y el tratarse de unaenciclopedia libre disponible para descarga en formato XML. Las herramientas y los corpus generadosdispondrán de licencia libre GPL (General Public License)

    • English

      This article describes an automatic method to select comparable corpora from Wikipedia usingcategories as topic restrictions. Our strategy is based on two properties of Wikipedia: to be amultilingual resource and to be a free encyclopedia available in a XML file. Tools and corpus will bedistributed under GPL license (General Public License).


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno