Clasificación supervisada de eventos raros para anticipar roturas del papel: comparación de estrategias de selección de variables y ajuste de modelos
Share
Date
2025-12-07Author
Alfonso Patiño, Jhonatan
Advisor
Vélez Jaramillo, SebastiánCitación
Bibliographic managers
Regional / Country coverage
ccav_-_dosquebradasMetadata
Show full item record
PDF Document
Description of the content
Este proyecto aborda la predicción temprana de roturas del papel en una línea de producción como un problema de clasificación supervisada con clase positiva rara. Se construye un conjunto de datos multivariado con variables de proceso estandarizadas y un esquema de entrenamiento, validación y prueba que respeta el orden temporal y evita la fuga de información. Para obtener un conjunto de predictores parsimonioso y con baja colinealidad se comparan dos enfoques de selección de variables: (A) filtrado univariado con correlación de Spearman y umbrales de baja correlación entre predictores; y (B) Elastic Net con búsqueda de hiperparámetros guiada por PR-AUC, seguido de Forward Selection controlando redundancia. Con el conjunto seleccionado se entrenan y comparan modelos de clasificación como regresión logística penalizada, Random Forest, máquinas de vectores de soporte (SVM) y XGBoost, empleando ponderación de clases y ajuste de hiperparámetros. Dado el desbalance severo, la métrica principal de evaluación es PR-AUC, complementada con ROC-AUC, precisión, recall, F1, matrices de confusión y medidas de lift para escenarios operativos. Los resultados permiten seleccionar un modelo candidato para la anticipación de roturas y discutir su viabilidad operativa, así como delinear recomendaciones metodológicas y líneas de trabajo futuro.























