Para esto, recopilamos datos relacionados con la estructura organizacional, niveles de renta, género, antigüedad, edad, evaluaciones de desempeño, tipos de contratos y niveles de estudios, entre otros. Junto a lo anterior, incluimos información externa, que podría impactar en la posibilidad de salida, como el nivel de desempleo, crecimiento y existencia de competidores.
Antes de generar el modelo, tuvimos que decidir si buscaríamos optimizar Accuracy, Recall o una combinación de éstos. La opción fue generar modelos optimizando Accuracy y, posteriormente, Recall, para comparar los resultados y tomar la mejor decisión.
El primer paso fue realizar un análisis exploratorio de los datos, donde pudimos concluir que el 80% de las salidas estaban asociadas a la familia de cargo Asistente de servicios. Dado esto, se decidió generar dos modelos, uno específico para dicha familia de cargo y otro para el resto de los cargos. ¿Por qué hicimos esto? Esto era importante, puesto que, de no hacerlo, el modelo habría estado sesgado hacia dicha familia de cargo. Dicho de otra forma, podríamos haber tenido un Accuracy del 90%, en el cual todas las predicciones correctas habrían estado asociadas al cargo Asistente de servicios y ninguna a los otros cargos.
Con toda esta información se generó un modelo predictivo de salida para el cargo Asistentes de servicios y otro para los restantes cargos. El primero logró un Accuracy del 85% y Recall del 77% (Precisión del 86%). El segundo modelo, si bien tuvo valores similares en Accuracy, tuvo menores resultados en Recall. Posteriormente analizamos las variables más importantes en cada modelo. En el caso de Asistentes de servicio, las variables mas importantes eran la renta y la antigüedad en la empresa, centrándose la rotación en personas jóvenes, con baja antigüedad en la empresa y con un nivel de renta inferior a un determinado umbral. En el segundo modelo, la variable más relevante era la antigüedad, por lo que era más probable que personas con mayor experiencia dejaran la organización.
¿Por qué en determinados cargos las personas con mayor antigüedad tenían una mayor probabilidad de dejar la empresa? Lo que concluimos con el cliente es que este se debía a la aparición de un competidor agresivo en el mercado.
Tomando estas conclusiones, el cliente pudo realizar un análisis económico sobre las inversiones que debería realizar para disminuir la rotación y los ahorros que esto traería para la empresa. Finalmente decidió aceptar el nivel de rotación en el cargo de Asistente se servicios, pero invertir en la retención de las personas con experiencia que estaban siendo contratados por la competencia.
En este desafiante proyecto, nos embarcamos en la construcción de un modelo predictivo de riesgo de rotación de personal utilizando Machine Learning. Al recopilar datos internos y externos, como estructura organizativa, renta, género, evaluaciones de desempeño y contexto económico, se desarrolló un modelo optimizado para prever movimientos de personal. Un análisis exploratorio inicial condujo a la creación de modelos específicos según la familia de cargos, evitando sesgos y obteniendo precisiones diferenciadas. La revelación de factores clave en la rotación permitió al cliente implementar medidas estratégicas para retener a los empleados, apoyando así la visión y el crecimiento de la organización.