Ayuda
Ir al contenido

Dialnet


Medición y comparación del rendimiento de cuatro algoritmos de aprendizaje supervisado para formular modelos predictivos sobre la rotación temprana de personal

    1. [1] Tecnológico Nacional de México/Instituto Tecnológico de San Luis Potosí
  • Localización: Esic market, ISSN 0212-1867, Vol. 54, Nº 2, 2023
  • Idioma: español
  • Títulos paralelos:
    • Measurement and comparison of the performance of four supervised learning algorithms to formulate predictive models on early employee turnover
  • Enlaces
  • Resumen
    • español

      Objetivo: Esta investigación tiene el objetivo de comparar el rendimiento-eficacia de cuatro algoritmos de aprendizaje supervisado (Arboles de Clasificación y Regresión-CART, Bosques Aleatorios de Clasificación, Multivariate Adaptative Regression Splines-MARS y Regresión Logística-LOGIT) para el modelado predictivo de la rotación temprana de personal en la industria manufacturera.

      Diseño Metodológico: Se realizó una investigación de tipo cuantitativo, alcance correlacional y diseño transversal no experimental. Como instrumento de recolección de información se diseñó un cuestionario, y para el análisis estadístico y modelado matemático se utilizó el software Salford Predictive Modeler - SPM. Como predictores de rotación se seleccionaron factores sociodemográficos y psicosociales de los candidatos y como variable de respuesta se calculó un indicador de estabilidad-rotación basado en el historial del candidato. Para comparar el rendimiento de los modelos se utilizaron curvas ROC (Receiver Operating Characteristic), matrices de confusión y Log-verosimilitud negativa promedio.

      Resultados: Se encontró que MARS es el algoritmo que ofrece mejor rendimiento con un área bajo la curva ROC de 89% y una precisión de 82% según la matriz de confusión.

      Implicaciones prácticas: MARS tiene la singularidad de que, para el caso que nos ocupa, reduce el modelo a un solo predictor importante. Al identificar las subregiones del predictor clave, se abren otras posibilidades de análisis; por ejemplo, en la región donde la contribución de la edad a la variable estabilidad laboral es cero (antes de los 28 años), se puede modelar con el resto de los predictores. Esto sugiere como implicación relevante que se pueden formular modelos diferenciados según la edad de los trabajadores, pues la importancia de los predictores cambia de acuerdo a la cohorte generacional.

    • English

      Objective: This research has the objective of comparing the performance-effectiveness of four predictive algorithms (Classification and Regression Trees-CART, Random Forests of Classification, Multivariate Adaptative Regression Splines-MARS, and Logistic Regression-LOGIT) for predictive modeling of early personnel turnover in the manufacturing industry.

      Methodological Design: Quantitative research, correlational scope and nonexperimental cross-sectional design were performed. A questionnaire was designed to collect information, and Salford Predictive Modeler -SPM software was used for statistical analysis and mathematical modeling. Sociodemographic and psychosocial factors of the candidates were selected as predictors of rotation and a stability-rotation indicator based on the candidate’s history was calculated as a response variable. To compare the performance of the models, ROC (Receiver Operating Characteristic) curves, confusion matrices and average negative Log-likelihood were used. This suggests as a relevant implication that differentiated models can be formulated according to the age of the workers, since the importance of the predictors changes according to the generational cohort.

      Results: It was found that MARS is the ranking algorithm that offers best performance with an area under the ROC curve of 89% and an accuracy of 82% according to the confusion matrix.

      Practical implications: MARS has the singularity that, for the present case, reduces the model to a single important predictor. By identifying the subregions of the key predictor, it opens up other possibilities for analysis; for example, in the region where the contribution of age to the work stability variable is zero (before 28 years), it can be modeled with the rest of the predictors, thus constructing a model with a complementary training function.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno