Danny Villegas Rivas, Manuel Milla Pino, Yary Pérez Pérez, Salli Villegas Rivas, Oscar Gamarra, Víctor Carril Fernández, Ricardo Shimabuku Ysa
En este trabajo se compararon métodos basados en distancias multivariadas para la detección de observacionesatípicas en series de precipitación mensual provenientes de una estación meteorológica y de un estudio de simu-lación con tres modelos de eventos extremos y un modelo lineal con armónicos y errores autorregresivos AR(1)para distintos períodos de tiempo. Los resultados mostraron que la precipitación en San Cristobal, Venezuela noestá condicionada por las épocas de sequía y lluvia, evidenciando simetría no perfecta sin largas colas, norma-lidad, estacionalidad, alta variabilidad, observaciones atípicas, un ciclo anual con un máximo bien definido enjunio, residuos autocorrelacionados, en general características típicas del bosque seco tropical, y una tendencia adistribuirse como una Pearson III. En ese orden, de las tres metodologías multivariadas, la distancia de Mahala-nobis reportó los mejores resultados en relación al porcentaje de observaciones atípicas detectadas para periodosde 5 y 10 años y un modelo lineal con dos armónicos con datos reales, mientras que para periodos mayores a10 años el modelo lognormal mostró una tendencia similar a la serie estudiada que se estabilizó conforme seincrementó el periodo. De igual forma, la distancia Euclídea mostró un comportamiento similar al obtenido conla de Mahalanobis en un periodo de 5 años y una distribución lognormal, mientras que para períodos mayoresa 5 años el porcentaje de observaciones atípicas se incrementó significativamente al igual que ocurrió con losdemás modelos para periodos mayores a 5 años. De la misma manera, con la distancia Manhattan se observó uncomportamiento similar con un incremento del porcentaje de observaciones atípicas. Se evidenció una sobreesti-mación de la cantidad de observaciones atípicas con las distancias Euclídea y Manhattan, presumiendo un efectoperjudicial de la autocorrelación serial de los residuales sobre estas dos distancias. De igual manera, se observóla existencia de un potencial efecto de empantanamiento, con fracciones de observaciones atípicas mayores que1/(n+1), en períodos mayores a 5 años. Por otro lado, la distribución lognormal en un periodo de 5 años tuvoun efecto favorable sobre las distancias Euclídea y Manhattan, y sobre la de Mahalanobis en periodos mayores a10 años, mientras que los modelos lineales con dos armónicos para períodos menores o iguales a 10 años mostróun efecto positivo sobre la distancia de Mahalanobis.
n this paper, methods based on multivariate distances for the detection of atypical observations in monthly pre-cipitation series from a meteorological station and a simulation study were compared with three models of extre-me events and a linear model with harmonics and autoregressive AR(1) errors for different periods of time. Theprecipitation in San Cristobal, Venezuela is not conditioned by times of drought and rain, showing non-perfectsymmetry without long tails, normality, seasonality, high variability, atypical observations, an annual cycle witha well-defined maximum in June, autocorrelated residuals, in general typical characteristics of the tropical dryforest, and a tendency to be distributed as a pearson III. The mahalanobis distance reported the best results inrelation to the percentage of atypical observations detected for periods of 5 and 10 years and a linear model withtwo harmonics with real data, while for periods greater than 10 years the Lognormal model showed a trend similarto the series studied that stabilized as the period increased. The euclidean distance showed a behavior similar tothat obtained with mahalanobis in a period of 5 years and a lognormal distribution, while for periods greater than 5years the percentage of atypical observations increased significantly as happened with the other models for periodslonger than 5 years. The Manhattan distance showed an increase in the percentage of atypical observations. Anoverestimation of the amount of atypical observations with the euclidean and manhattan distances was evidenced,presuming a detrimental effect of the serial autocorrelation of the residuals on these two distances. The existence ofa potential bogging effect was observed, with fractions of atypical observations greater than 1/(n+1), in periodsgreater than 5 years. The lognormal distribution over a period of 5 years had a favorable effect on the euclideanand manhattan distances, and on that of mahalanobis in periods greater than 10 years, while the linear models withtwo harmonics for periods less than or equal to 10 years showed a positive effect on the mahalanobis distance.
© 2001-2025 Fundación Dialnet · Todos los derechos reservados