| dc.contributor.advisor | Montenegro Embus, Bryan Andru | |
| dc.coverage.spatial | cead_-_medellín | |
| dc.creator | Muñoz Carmona, Juan Pablo | |
| dc.date.accessioned | 2026-06-10T21:51:29Z | |
| dc.date.available | 2026-06-10T21:51:29Z | |
| dc.date.created | 2026-06-06 | |
| dc.identifier.uri | https://repository.unad.edu.co/handle/10596/82159 | |
| dc.description.abstract | La proyección de la demanda eléctrica es un desafío global que requiere herramientas
avanzadas para reducir la incertidumbre generada por la variabilidad climática y otras
condiciones socioeconómicas de cada región. Colombia se enfrenta a retos específicos asociados
al crecimiento de la población y la alta dependencia de generación hidroeléctrica, lo cual hace
indispensable el desarrollo e implementación de metodologías robustas de estimación de la
demanda. En consecuencia, se implementó un proceso de evaluación de dos modelos de series de
tiempo y Machine Learning para estimar la demanda de energía eléctrica en Colombia en
resoluciones diaria y mensual a partir de datos entre enero de 2015 y diciembre de 2025 y
generar pronósticos para el horizonte 2026-2029 con base en la metodología CRISP-DM. Se
realizó un análisis exploratorio de datos para comprender la dinámica temporal y la asociación
estadística de la demanda eléctrica y los aportes hidrológicos, el volumen de los embalses, el
Producto Interno Bruto (PIB) y el crecimiento de la población. A pesar de la fuerte relación entre
la población y la demanda eléctrica, se realizó el modelado sin esta ni el PIB debido a su
resolución temporal (anual y trimestral, respectivamente).
En el modelado se realizó la comparación del enfoque univariado (solo demanda) y un
enfoque multivariado (demanda, aportes hidrológicos, volumen de embalses). Fueron
implementadas dos arquitecturas: 1) modelo híbrido con series de tiempo y Machine Learning y
2) modelo aditivo generalizado basado en series de tiempo, Prophet. Las métricas para evaluar el
desempeño predictivo fueron la raíz del error cuadrático medio (RMSE), el promedio del error
absoluto porcentual (MAPE) y el promedio del error escalado absoluto (MASE). La información
fue recopilada de XM, el DANE y la UPME. Tras la búsqueda de los hiperparámetros óptimos
para cada configuración, el modelo campeón fue el híbrido univariado mensual. El Pipeline para garantizar la reproducibilidad de los resultados de la investigación fue consignado en 4 scripts de
Python. En términos generales se evidenció que el enfoque univariado tuvo mejores resultados
en todos los procesos de modelado. Las estimaciones del modelo campeón fueron comparadas
con proyecciones oficiales de la UPME y el MAPE fue de 2.4%. | |
| dc.format | pdf | |
| dc.title | Modelos de predicción de la demanda eléctrica y detección de picos de consumo mediante series de tiempo y Machine Learning | |
| dc.type | Proyecto aplicado | |
| dc.subject.keywords | Demanda eléctrica | |
| dc.subject.keywords | Ciencia de datos | |
| dc.subject.keywords | Prophet | |
| dc.subject.keywords | Series de tiempo | |
| dc.subject.keywords | Machine learning | |
| dc.description.abstractenglish | The projection of electricity demand is a global challenge that requires advanced tools to
reduce the uncertainty generated by climate variability and other socioeconomic conditions in
each region. Colombia faces specific challenges associated with population growth and high
dependence on hydroelectric generation, which makes the development and implementation of
robust demand estimation methodologies indispensable. Consequently, an evaluation process of
two time series and Machine Learning models was implemented to estimate the demand for
electricity in Colombia in daily and monthly resolutions based on data between January 2015 and
December 2025 and generate forecasts for the 2026-2029 horizon based on the CRISP-DM
methodology. An exploratory data analysis was performed to understand the temporal dynamics
and statistical association of electricity demand and hydrological inputs, reservoir volume, Gross
Domestic Product (GDP), and population growth. Despite the strong relationship between
population and electricity demand, the modelling was carried out without electricity demand or
GDP due to its temporal resolution (annual and quarterly, respectively).
In the modeling, the univariate approach (demand only) and a multivariate approach
(demand, hydrological inputs, reservoir volume) were compared. Two architectures were
implemented: 1) hybrid model with time series and Machine Learning and 2) generalized
additive model based on time series, Prophet. The metrics to evaluate predictive performance
were Root Mean Square Error (RMSE), Mean Percent Absolute Error (MAPE), and Mean
Absolute Scaled Error (MASE). The information was collected from XM, DANE and UPME.
After the search for the optimal hyperparameters for each configuration, the champion model
was the monthly univariate hybrid. The Pipeline to guarantee the reproducibility of the research
results was consigned to four Python scripts. In general terms, it was evidenced that the univariate approach had better results in all modeling processes. The estimates of the champion
model were compared with official projections of the UPME and the MAPE was 2.4%. | |
| dc.subject.category | Ciencia de datos | |