Una de las etapas del enlace de registros es el de la segmentacion, cuyo objetivo es el de separar las entidades presentes en un campo para facilitar las comparaciones. Por ejemplo, un campo que contiene el nombre y apellidos puede ser separado en tres nuevos campos, nombre, primer apellido y segundo apellido. Se pueden distinguir tres fases principales.
I) Fase de etiquetado, usando una muestra que hemos seleccionado previamente de nuestro chero o de otro que tenga una estructura similar. II) Fase manual de asignaci on de estados a las etiquetas generadas en la primera fase. III) Fase de entrenamiento:
obtener las probabilidades de transicion de un estado a otro y obtener las probabilidades de observacion de un estado por cada etiqueta. En este trabajo se describen los resultados del ajuste de modelos ocultos de Markov a nombres y direcciones postales a partir de bases de datos del Instituto de Estadstica de Andaluca.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados