Evaluación de los modelos CatBoost, LightGBM y XGBoost para la identificación de consumos anómalos asociados a pérdidas no técnicas en sistemas de distribución de energía eléctrica

López Chaverra, Anderson

dc.contributor.advisor	Pineda Martinez Esneider de Jesús
dc.coverage.spatial	cead_-_popayán
dc.creator	López Chaverra, Anderson
dc.date.accessioned	2026-03-16T21:33:07Z
dc.date.available	2026-03-16T21:33:07Z
dc.date.created	2026-03-06
dc.identifier.uri	https://repository.unad.edu.co/handle/10596/79590
dc.description.abstract	Las pérdidas no técnicas (PNT) de energía eléctrica asociadas principalmente a fraudes y errores de medición siguen impactando la rentabilidad de los operadores de red latinoamericanos. La literatura coincide en que los algoritmos de gradient boosting alcanzan los excelentes resultados de detección; no obstante, esos estudios se han realizado en contextos de datos y condiciones operativas diferentes a las de la empresa distribuidora colombiana analizada en este proyecto. En consecuencia, el presente trabajo replica tres modelos de clasificación tal como: CatBoost (CGB), LightGBM (LGB) y XGBoost (XGB), utilizando un dataset histórico que incluye lecturas mensuales, así como variables técnicas de los equipos de medida. Tras aplicar limpieza, normalización, balanceo de clases y generación de variables derivadas, cada algoritmo será optimizado y evaluado con F1 Score, Recall y Precisión mediante validación cruzada estratificada. El estudio busca comprobar si los altos niveles de desempeño mostrados en otros entornos se reproducen en la realidad local, y determinar qué modelo ofrece la mejor capacidad predictiva para futuras implementaciones de analítica de pérdidas.
dc.format	pdf
dc.title	Evaluación de los modelos CatBoost, LightGBM y XGBoost para la identificación de consumos anómalos asociados a pérdidas no técnicas en sistemas de distribución de energía eléctrica
dc.type	Proyecto aplicado
dc.subject.keywords	Pérdidas no técnicas
dc.subject.keywords	Detección de fraude
dc.subject.keywords	Aprendizaje automático
dc.subject.keywords	Gradient Boosting
dc.description.abstractenglish	Non-technical losses (NTL) of electrical energy, primarily associated with fraud and measurement errors, continue to impact the profitability of power network operators in Latin America. The literature agrees that gradient boosting algorithms achieve excellent detection results; however, these studies have been conducted in contexts with different data and operational conditions compared to those of the Colombian distribution company analyzed in this project. Consequently, this work replicates three classification models: CatBoost (CGB), LightGBM (LGB), and XGBoost (XGB), using a historical dataset that includes monthly readings as well as technical variables from the metering equipment. After applying data cleaning, normalization, class balancing, and the generation of derived features, each algorithm will be optimized and evaluated with F1 Score, Recall and Precision, through stratified cross-validation. The study aims to verify whether the high-performance levels shown in other environments can be replicated in the local context, and to determine which model provides the best predictive capability for future loss analytics implementations.
dc.subject.category	Ingeniería Eléctrica
dc.subject.category	Machine Learning
dc.subject.category	Estadística y Probabilidades
dc.subject.category	Sistemas de Distribución Eléctrica y Energía