Ayuda
Ir al contenido

Dialnet


Resumen de How to work with smaller corpora of indigenous languages

Regina Pustet

  • español

    La lingüística de corpus actual rara vez tiene en cuenta datos de lenguas indígenas. Sin embargo, tardeo temprano, las generalizaciones y métodos teóricos que se extraen de este enfoque necesitancontrastarse con datos “exóticos”, es decir, de las lenguas no indoeuropeas. No se puede asumir que loshechos extraídos únicamente de corpus de lenguas indoeuropeas representan la totalidad de losfenómenos relacionados con corpus que se encuentran en las lenguas habladas en este planeta. Sinembargo, desde la perspectiva de la lingüística de corpus estándar, trabajar con corpus de lenguasindígenas está plagado de dificultades, principalmente porque dichos corpus no están disponibles, oporque son mucho más pequeños que los existentes de lenguas indoeuropeas. Basándonos en datos de lalengua nativa americana Lakota, esta ponencia demuestra que corpus más pequeños (20.000+ palabras)son suficientes para muchos tipos de análisis de corpus con significado teórico, especialmente aquelloscentrados en elementos gramaticales.

  • English

    Current corpus linguistics rarely takes data from indigenous languages into account. Sooner or later,however, the theoretical generalizations and methods produced by this approach need to be testedagainst data from "exotic", i.e. non-Indo-European languages. It cannot be assumed that the factsextracted from corpora of Indo-European languages alone represent the totality of corpus-relatedphenomena to be discovered in the languages spoken on this planet. From the perspective of standardcorpus linguistics, however, working with corpora from indigenous languages is fraught with difficulties,mainly because such corpora either are not available at all, or they are much smaller than averagecorpora from Indo-European languages. On the basis of data from the Native American languageLakota, this paper demonstrates that for many types of theoretically significant corpus analyses,especially those which target grammatical items, smaller corpora (20 000+ words) are sufficient


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus