Modelos de predicción de la demanda eléctrica y detección de picos de consumo mediante series de tiempo y Machine Learning

Muñoz Carmona, Juan Pablo

dc.contributor.advisor	Montenegro Embus, Bryan Andru
dc.coverage.spatial	cead_-_medellín
dc.creator	Muñoz Carmona, Juan Pablo
dc.date.accessioned	2026-06-10T21:51:29Z
dc.date.available	2026-06-10T21:51:29Z
dc.date.created	2026-06-06
dc.identifier.uri	https://repository.unad.edu.co/handle/10596/82159
dc.description.abstract	La proyección de la demanda eléctrica es un desafío global que requiere herramientas avanzadas para reducir la incertidumbre generada por la variabilidad climática y otras condiciones socioeconómicas de cada región. Colombia se enfrenta a retos específicos asociados al crecimiento de la población y la alta dependencia de generación hidroeléctrica, lo cual hace indispensable el desarrollo e implementación de metodologías robustas de estimación de la demanda. En consecuencia, se implementó un proceso de evaluación de dos modelos de series de tiempo y Machine Learning para estimar la demanda de energía eléctrica en Colombia en resoluciones diaria y mensual a partir de datos entre enero de 2015 y diciembre de 2025 y generar pronósticos para el horizonte 2026-2029 con base en la metodología CRISP-DM. Se realizó un análisis exploratorio de datos para comprender la dinámica temporal y la asociación estadística de la demanda eléctrica y los aportes hidrológicos, el volumen de los embalses, el Producto Interno Bruto (PIB) y el crecimiento de la población. A pesar de la fuerte relación entre la población y la demanda eléctrica, se realizó el modelado sin esta ni el PIB debido a su resolución temporal (anual y trimestral, respectivamente). En el modelado se realizó la comparación del enfoque univariado (solo demanda) y un enfoque multivariado (demanda, aportes hidrológicos, volumen de embalses). Fueron implementadas dos arquitecturas: 1) modelo híbrido con series de tiempo y Machine Learning y 2) modelo aditivo generalizado basado en series de tiempo, Prophet. Las métricas para evaluar el desempeño predictivo fueron la raíz del error cuadrático medio (RMSE), el promedio del error absoluto porcentual (MAPE) y el promedio del error escalado absoluto (MASE). La información fue recopilada de XM, el DANE y la UPME. Tras la búsqueda de los hiperparámetros óptimos para cada configuración, el modelo campeón fue el híbrido univariado mensual. El Pipeline para garantizar la reproducibilidad de los resultados de la investigación fue consignado en 4 scripts de Python. En términos generales se evidenció que el enfoque univariado tuvo mejores resultados en todos los procesos de modelado. Las estimaciones del modelo campeón fueron comparadas con proyecciones oficiales de la UPME y el MAPE fue de 2.4%.
dc.format	pdf
dc.title	Modelos de predicción de la demanda eléctrica y detección de picos de consumo mediante series de tiempo y Machine Learning
dc.type	Proyecto aplicado
dc.subject.keywords	Demanda eléctrica
dc.subject.keywords	Ciencia de datos
dc.subject.keywords	Prophet
dc.subject.keywords	Series de tiempo
dc.subject.keywords	Machine learning
dc.description.abstractenglish	The projection of electricity demand is a global challenge that requires advanced tools to reduce the uncertainty generated by climate variability and other socioeconomic conditions in each region. Colombia faces specific challenges associated with population growth and high dependence on hydroelectric generation, which makes the development and implementation of robust demand estimation methodologies indispensable. Consequently, an evaluation process of two time series and Machine Learning models was implemented to estimate the demand for electricity in Colombia in daily and monthly resolutions based on data between January 2015 and December 2025 and generate forecasts for the 2026-2029 horizon based on the CRISP-DM methodology. An exploratory data analysis was performed to understand the temporal dynamics and statistical association of electricity demand and hydrological inputs, reservoir volume, Gross Domestic Product (GDP), and population growth. Despite the strong relationship between population and electricity demand, the modelling was carried out without electricity demand or GDP due to its temporal resolution (annual and quarterly, respectively). In the modeling, the univariate approach (demand only) and a multivariate approach (demand, hydrological inputs, reservoir volume) were compared. Two architectures were implemented: 1) hybrid model with time series and Machine Learning and 2) generalized additive model based on time series, Prophet. The metrics to evaluate predictive performance were Root Mean Square Error (RMSE), Mean Percent Absolute Error (MAPE), and Mean Absolute Scaled Error (MASE). The information was collected from XM, DANE and UPME. After the search for the optimal hyperparameters for each configuration, the champion model was the monthly univariate hybrid. The Pipeline to guarantee the reproducibility of the research results was consigned to four Python scripts. In general terms, it was evidenced that the univariate approach had better results in all modeling processes. The estimates of the champion model were compared with official projections of the UPME and the MAPE was 2.4%.
dc.subject.category	Ciencia de datos