Barcelona, España
Cuando se realiza un estudio epidemiológico nutricional, es inevitable que aparezcan valores ausentes y atípicos. Los datos ausentes aparecen, por ejemplo, por la dificultad de recoger los datos en las encuestas dietéticas que conducen a una falta de información sobre la cantidad de alimentos consumidos y una pobre descripción de ellos. Un inadecuado tratamiento durante el proceso de recolección nos conduce a sesgos y pérdida de precisión y consecuentemente una incorrecta interpretación de los resultados. El objetivo de este artículo es proporcionar recomendaciones sobre el tratamiento de datos ausentes y atípicos, y algunas orientaciones sobre el software existente para calcular el tamaño de muestra y realizar el análisis estadístico. También se realizan recomendaciones sobre la recolección de datos que es un paso importante en la investigación nutricional. Se comentan los métodos que se usan para hacer frente a los datos ausentes, específicamente, el método eliminación de casos, imputación simple o múltiple con indicaciones y ejemplos. También se relata cómo se identifican datos atípicos, el impacto que tienen en el análisis estadístico, las opciones para un adecuado tratamiento y se ilustra mediante un ejemplo. Finalmente, se menciona el software existente que aborda total o parcialmente las cuestiones tratadas, específicamente el software de libre distribución.
When performing nutritional epidemiology studies, missing values and outliers inevitably appear. Missing values appear, for example, because of the difficulty in collecting data in dietary surveys, leading to a lack of data on the amounts of foods consumed or a poor description of these foods. Inadequate treatment during the data processing stage can create biases and loss of accuracy and, consequently, misinterpretation of the results. The objective of this article is to provide some recommendations about the treatment of missing and outlier data, and orientation regarding existing software for the determination of sample sizes and for performing statistical analysis. Some recommendations about data collection are provided as an important previous step in any nutritional research. We discuss methods used for dealing with missing values, especially the case deletion method, simple imputation and multiple imputation, with indications and examples. Identification, impact on statistical analysis and options available for adequate treatment of outlier values are explained, including some illustrative examples. Finally, the current software that totally or partially addresses the questions treated is mentioned, especially the free software available.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados