Ayuda
Ir al contenido

Dialnet


Desafíos metodológicos en la imputación de ingresos: un análisis crítico del uso de aprendizaje automático en encuestas de hogares

    1. [1] Universidad de Buenos Aires

      Universidad de Buenos Aires

      Argentina

  • Localización: Lavboratorio: revista de estudios sobre cambio estructural y desigualdad social, ISSN-e 1852-4435, Nº. 34, 1, 2024 (Ejemplar dedicado a: Viejas realidades y nuevos emergentes de la precariedad laboral en América Latina y su abordaje desde las políticas públicas), págs. 289-312
  • Idioma: español
  • Títulos paralelos:
    • Desafios metodológicos na imputação de rendimentos: uma análise crítica do uso de aprendizado de máquina em pesquisas domiciliares
  • Enlaces
  • Resumen
    • español

      La corrección de la no respuesta a ingresos es un problema importante en el preprocesamiento de los datos que se utilizan para la construcción de estadísticas sociales sobre la base de encuestas de hogares. En el presente trabajo se busca indagar la utilidad de dos herramientas de aprendizaje automático como árboles aleatorios y regresión lineal robusta y, por otro lado, una técnica estadística 'tradicional' como hot-deck para la imputación de la no respuesta. Para su testeo se utilizó la respuesta efectiva al ingreso de la ocupación principal correspondiente a la base de personas de la Encuesta Permanente de Hogares del cuarto trimestre de 2022. Se hace foco para ello no en la búsqueda del mejor modelo, sino en cómo evaluar el rendimiento y el impacto en términos de varianza muestral, error cuadrático medio, error medio absoluto y sesgo.

      En segundo lugar, se observó cómo esto repercute en las estimaciones del coeficiente de Gini y la brecha de ingresos entre varones y mujeres.

    • português

      A correção da não resposta a rendimentos é um problema importante no pré-processamento dos dados utilizados para a construção de estatísticas sociais com base em pesquisas domiciliares.

      Neste trabalho, busca-se investigar a utilidade de duas ferramentas de aprendizado de máquina, como árvores aleatórias e regressão linear robusta, e, por outro lado, uma técnica estatística 'tradicional' como o hot-deck para a imputação da não resposta. Para o teste, utilizou-se a resposta efetiva ao rendimento da ocupação principal correspondente à base de pessoas da Pesquisa Permanente por Amostra de Domicílios do quarto trimestre de 2022. O foco não é na busca do melhor modelo, mas sim em como avaliar o desempenho e o impacto em termos de variância amostral, erro quadrático médio, erro médio absoluto e viés. Em segundo lugar, observou-se como isso repercute nas estimativas do coeficiente de Gini e na disparidade de rendimentos entre homens e mulheres.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno