Afficher la notice abrégée

dc.contributor.advisorPineda Martinez Esneider de Jesús
dc.coverage.spatialcead_-_popayán
dc.creatorLópez Chaverra, Anderson
dc.date.accessioned2026-03-16T21:33:07Z
dc.date.available2026-03-16T21:33:07Z
dc.date.created2026-03-06
dc.identifier.urihttps://repository.unad.edu.co/handle/10596/79590
dc.description.abstractLas pérdidas no técnicas (PNT) de energía eléctrica asociadas principalmente a fraudes y errores de medición siguen impactando la rentabilidad de los operadores de red latinoamericanos. La literatura coincide en que los algoritmos de gradient boosting alcanzan los excelentes resultados de detección; no obstante, esos estudios se han realizado en contextos de datos y condiciones operativas diferentes a las de la empresa distribuidora colombiana analizada en este proyecto. En consecuencia, el presente trabajo replica tres modelos de clasificación tal como: CatBoost (CGB), LightGBM (LGB) y XGBoost (XGB), utilizando un dataset histórico que incluye lecturas mensuales, así como variables técnicas de los equipos de medida. Tras aplicar limpieza, normalización, balanceo de clases y generación de variables derivadas, cada algoritmo será optimizado y evaluado con F1 Score, Recall y Precisión mediante validación cruzada estratificada. El estudio busca comprobar si los altos niveles de desempeño mostrados en otros entornos se reproducen en la realidad local, y determinar qué modelo ofrece la mejor capacidad predictiva para futuras implementaciones de analítica de pérdidas.
dc.formatpdf
dc.titleEvaluación de los modelos CatBoost, LightGBM y XGBoost para la identificación de consumos anómalos asociados a pérdidas no técnicas en sistemas de distribución de energía eléctrica
dc.typeProyecto aplicado
dc.subject.keywordsPérdidas no técnicas
dc.subject.keywordsDetección de fraude
dc.subject.keywordsAprendizaje automático
dc.subject.keywordsGradient Boosting
dc.description.abstractenglishNon-technical losses (NTL) of electrical energy, primarily associated with fraud and measurement errors, continue to impact the profitability of power network operators in Latin America. The literature agrees that gradient boosting algorithms achieve excellent detection results; however, these studies have been conducted in contexts with different data and operational conditions compared to those of the Colombian distribution company analyzed in this project. Consequently, this work replicates three classification models: CatBoost (CGB), LightGBM (LGB), and XGBoost (XGB), using a historical dataset that includes monthly readings as well as technical variables from the metering equipment. After applying data cleaning, normalization, class balancing, and the generation of derived features, each algorithm will be optimized and evaluated with F1 Score, Recall and Precision, through stratified cross-validation. The study aims to verify whether the high-performance levels shown in other environments can be replicated in the local context, and to determine which model provides the best predictive capability for future loss analytics implementations.
dc.subject.categoryIngeniería Eléctrica
dc.subject.categoryMachine Learning
dc.subject.categoryEstadística y Probabilidades
dc.subject.categorySistemas de Distribución Eléctrica y Energía


Fichier(s) constituant ce document

Thumbnail

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée