Ayuda
Ir al contenido

Dialnet


Resumen de Un método de compresión bigramática posicional

Javier Gurrutxaga Vázquez, José Luis García Mandinabeitia, Julio Abascal González, Félix Ares de Blas

  • español

    Este trabajo describe lo que hemos llamado COMPRESIÓN BIGRAMÁTICA POSICIONAL, consistente en un método para la compresión de ficheros de apellidos y nombres en castellano. Se basa en una modificación del método de compresión bigramática clásico al que se le aplica el concepto de posicionalidad de los caracteres dentro de la palabra. La posicionalidad aquí tenida en cuenta consiste en que la probabilidad de aparición de ciertos bloques multiletra es diferente en el principio, en el medio y en el final de la palabra. En un trabajo precedente (1), utilizando el método de compresión bigramática clásico se llegaba a un acompresión relativa de 0,414. En el presente estudio, donde se han empleado los mismos textos que en el artículo mencionado, con la misma definición de compresión se obtiene una compresión del 0,4743 que representa una mejoría del 6%.

  • English

    This work describes that which we have named POSITIONAL BIGRAMMATICAL COMPRESSION, that is a method for the compression of the spanish full names filles.

    It's based on a modification of the clasical biogrammatical compression method with the addition of the word 's characters positionality concept.

    The positionality that we are taking into account here is dealing with the fact that the apparition's probability of some multiletters blocks is different in the words begining than in the middle or the end.

    In a precedent work by E. García Camarero and L. Bengoechea Martínez using a version of the clasical biogrammatical compression method, the result was a relative compression of 0,4143 with 125 symbols. In the present paper, working with the same full names fille, with 128 positional symbols, and with the same compression definition, based on the remove characters, we have a compression of 0,4743 which is 6% better. When we calculate the compression, taking into account the removed bits, the improvement is 7%.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus