Please use this identifier to cite or link to this item:
https://repository.unad.edu.co/handle/10596/78874Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.advisor | Vélez Jaramillo, Sebastián | |
| dc.coverage.spatial | ccav_-_dosquebradas | |
| dc.creator | Alfonso Patiño, Jhonatan | |
| dc.date.accessioned | 2026-02-18T15:00:43Z | |
| dc.date.available | 2026-02-18T15:00:43Z | |
| dc.date.created | 2025-12-07 | |
| dc.identifier.uri | https://repository.unad.edu.co/handle/10596/78874 | |
| dc.description | ||
| dc.description.abstract | Este proyecto aborda la predicción temprana de roturas del papel en una línea de producción como un problema de clasificación supervisada con clase positiva rara. Se construye un conjunto de datos multivariado con variables de proceso estandarizadas y un esquema de entrenamiento, validación y prueba que respeta el orden temporal y evita la fuga de información. Para obtener un conjunto de predictores parsimonioso y con baja colinealidad se comparan dos enfoques de selección de variables: (A) filtrado univariado con correlación de Spearman y umbrales de baja correlación entre predictores; y (B) Elastic Net con búsqueda de hiperparámetros guiada por PR-AUC, seguido de Forward Selection controlando redundancia. Con el conjunto seleccionado se entrenan y comparan modelos de clasificación como regresión logística penalizada, Random Forest, máquinas de vectores de soporte (SVM) y XGBoost, empleando ponderación de clases y ajuste de hiperparámetros. Dado el desbalance severo, la métrica principal de evaluación es PR-AUC, complementada con ROC-AUC, precisión, recall, F1, matrices de confusión y medidas de lift para escenarios operativos. Los resultados permiten seleccionar un modelo candidato para la anticipación de roturas y discutir su viabilidad operativa, así como delinear recomendaciones metodológicas y líneas de trabajo futuro. | |
| dc.format | ||
| dc.title | Clasificación supervisada de eventos raros para anticipar roturas del papel: comparación de estrategias de selección de variables y ajuste de modelos | |
| dc.type | Proyecto aplicado | |
| dc.subject.keywords | Modelos de clasificación | |
| dc.subject.keywords | PR-AUC | |
| dc.subject.keywords | Desbalance de clases | |
| dc.subject.keywords | Industria papelera | |
| dc.subject.keywords | Rotura de hoja | |
| dc.description.abstractenglish | This project addresses the early prediction of paper breaks on a production line as a supervised classification problem with a rare positive class. A multivariate data set is constructed using standardized process variables and a train–validation–test scheme that respects temporal order and avoids information leakage. To obtain a parsimonious predictor set with low collinearity, two variable selection approaches are compared: (A) a univariate filter based on Spearman correlation and low-correlation thresholds between predictors, and (B) Elastic Net with hyperparameter search guided by PR-AUC, followed by Forward Selection with redundancy control. Using the selected set of predictors, classification models such as penalized logistic regression, Random Forest, support vector machines (SVM) and XGBoost are trained and compared, employing class weighting and hyperparameter tuning. Due to the severe class imbalance, the primary evaluation metric is PR-AUC, complemented by ROC-AUC, precision, recall, F1, confusion matrices, and lift measures for operational scenarios. The results enable the selection of a candidate model for anticipating paper breaks and the discussion of its operational feasibility, as well as outlining methodological recommendations and future work. | |
| dc.subject.category | Investigación | |
| Appears in Collections: | Especialización en Ciencia de Datos y Analítica | |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| jalfonsopa.pdf | 1.38 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.