Arrondissement d’Orléans, Francia
This work aims to automatically identify toponyms in text, It concerns natural language processing techniques and deals with toponym French spelling, especially with variations between standards and the way these are applied in a Web corpus. The definitions of toponym are manifold because they are closely related to the fields of study of the relevant disciplines. Because of the abundance of these disciplines, several bodies write reference frameworks about toponym spelling. These standards rely on concepts which fall within the fields of study: they are exposed and discuss: Terminological and ontological resources which are mandatory to automatically identify toponyms in texts are described. A tool is implemented and assessed, which takes into account both reference frameworks and variations found in the corpus. Our results validate the spelling assumptions which were implemented, thus enabling us to draw perspectives.
Le travail présenté vise la détection automatique des toponymes dans un texte. II se situe dans le domaine du traitement automatique des langues et porte sur l'écriture des toponymes en français, plus particulièrement sur les variations entre les normes et leur application dans un corpus Web. Les définitions d'un toponyme sont multiples parce qu'elles sont étroitement liées aux domaines d'étude des disciplines concernées. Du fait de la multiplicité de ces disciplines, différents organismes produisent des discours de référence concernant l'écriture des toponymes. Ces normes, qui s'appuient sur des concepts appartenant aux domaines d'étude, sont exposées et commentées. Des ressources termino-ontologiques, nécessaires pour reconnaître automatiquement des toponymes dans des textes, sont décrites. Un outil est développé et testé, qui tient compre des discours de référence mais aussi des variations observées dans le corpus. Les résultats obtenus valident les hypothèses de graphie implémentées dans l'outil et permettent de définir des perspectives.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados