Please use this identifier to cite or link to this item: https://repository.unad.edu.co/handle/10596/78874
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorVélez Jaramillo, Sebastián
dc.coverage.spatialccav_-_dosquebradas
dc.creatorAlfonso Patiño, Jhonatan
dc.date.accessioned2026-02-18T15:00:43Z
dc.date.available2026-02-18T15:00:43Z
dc.date.created2025-12-07
dc.identifier.urihttps://repository.unad.edu.co/handle/10596/78874
dc.description
dc.description.abstractEste proyecto aborda la predicción temprana de roturas del papel en una línea de producción como un problema de clasificación supervisada con clase positiva rara. Se construye un conjunto de datos multivariado con variables de proceso estandarizadas y un esquema de entrenamiento, validación y prueba que respeta el orden temporal y evita la fuga de información. Para obtener un conjunto de predictores parsimonioso y con baja colinealidad se comparan dos enfoques de selección de variables: (A) filtrado univariado con correlación de Spearman y umbrales de baja correlación entre predictores; y (B) Elastic Net con búsqueda de hiperparámetros guiada por PR-AUC, seguido de Forward Selection controlando redundancia. Con el conjunto seleccionado se entrenan y comparan modelos de clasificación como regresión logística penalizada, Random Forest, máquinas de vectores de soporte (SVM) y XGBoost, empleando ponderación de clases y ajuste de hiperparámetros. Dado el desbalance severo, la métrica principal de evaluación es PR-AUC, complementada con ROC-AUC, precisión, recall, F1, matrices de confusión y medidas de lift para escenarios operativos. Los resultados permiten seleccionar un modelo candidato para la anticipación de roturas y discutir su viabilidad operativa, así como delinear recomendaciones metodológicas y líneas de trabajo futuro.
dc.formatpdf
dc.titleClasificación supervisada de eventos raros para anticipar roturas del papel: comparación de estrategias de selección de variables y ajuste de modelos
dc.typeProyecto aplicado
dc.subject.keywordsModelos de clasificación
dc.subject.keywordsPR-AUC
dc.subject.keywordsDesbalance de clases
dc.subject.keywordsIndustria papelera
dc.subject.keywordsRotura de hoja
dc.description.abstractenglishThis project addresses the early prediction of paper breaks on a production line as a supervised classification problem with a rare positive class. A multivariate data set is constructed using standardized process variables and a train–validation–test scheme that respects temporal order and avoids information leakage. To obtain a parsimonious predictor set with low collinearity, two variable selection approaches are compared: (A) a univariate filter based on Spearman correlation and low-correlation thresholds between predictors, and (B) Elastic Net with hyperparameter search guided by PR-AUC, followed by Forward Selection with redundancy control. Using the selected set of predictors, classification models such as penalized logistic regression, Random Forest, support vector machines (SVM) and XGBoost are trained and compared, employing class weighting and hyperparameter tuning. Due to the severe class imbalance, the primary evaluation metric is PR-AUC, complemented by ROC-AUC, precision, recall, F1, confusion matrices, and lift measures for operational scenarios. The results enable the selection of a candidate model for anticipating paper breaks and the discussion of its operational feasibility, as well as outlining methodological recommendations and future work.
dc.subject.categoryInvestigación
Appears in Collections:Especialización en Ciencia de Datos y Analítica

Files in This Item:
File Description SizeFormat 
jalfonsopa.pdf1.38 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.