Ayuda
Ir al contenido

Dialnet


Resumen de Term based comparison metrics for controlled and uncontrolled indexing languages

Benjamin Good, Joseph T. Tennis

  • español

    Introducción. Definimos una colección de métricas para describir y comparar conjuntos de términos en lenguajes de indización controlados y no-controlados y mostramos cómo éstas métricas pueden usarse para caracterizar un conjunto de lenguajes que cubren fisonomías, ontologías y tesauros. Método. Se identificaron las métricas para la caracterización y comparación de conjuntos de términos y se implementaron los programas para su cómputo. Estos programas se usaron para identificar las características descriptivas de conjuntos de términos de veintidós diferentes lenguajes de indización y medir el solapamiento directo entre los términos. Análisis. Los datos computados fueron analizados mediante técnicas manuales y automatizadas, como visualización, agrupamiento y análisis factorial. Se buscaron distintos subconjuntos en las métricas que pudieran usarse para distinguir entre lenguajes no-controlados producidos por los sistemas de etiquetado sociales (fisionomías) y los lenguajes controlados producidos por el trabajo profesional. Resultados. Las métricas se mostraron suficientes para diferenciar entre instancias de diferentes lenguajes y para permitir la identificación de patrones término-conjunto asociados a lenguajes de indización producidos por diferentes tipos de sistema de información. En particular, distintos grupos de características término-conjunto parecen distinguir las fisonomías de otros lenguajes. Conclusiones. Las métricas aquí organizadas e incluidas en programas libremente disponibles proporcionan una visión empírica útil para empezar a entender las relaciones que se mantienen entre diferentes lenguajes de indización, controlados y no-controlados.

  • English

    Introduction. We define a collection of metrics for describing and comparing sets of terms in controlled and uncontrolled indexing languages and then show how these metrics can be used to characterize a set of languages spanning folksonomies, ontologies and thesauri.

    Method. Metrics for term set characterization and comparison were identified and programs for their computation implemented. These programs were then used to identify descriptive features of term sets from twenty-two different indexing languages and to measure the direct overlap between the terms.

    Analysis. The computed data were analysed using manual and automated techniques including visualization, clustering and factor analysis. Distinct subsets of the metrics were sought that could be used to distinguish between the uncontrolled languages produced by social tagging systems (folksonomies) and the controlled languages produced using professional labour.

    Results. The metrics proved sufficient to differentiate between instances of different languages and to enable the identification of term-set patterns associated with indexing languages produced by different kinds of information system. In particular, distinct groups of term-set features appear to distinguish folksonomies from the other languages.

    Conclusions. The metrics organized here and embodied in freely available programs provide an empirical lens useful in beginning to understand the relationships that hold between different, controlled and uncontrolled indexing languages.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus