Please use this identifier to cite or link to this item: https://repository.unad.edu.co/handle/10596/81250
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorMontenegro Embus, Brayan Andru
dc.coverage.spatialcead_-_la_dorada
dc.creatorRojas Galvis, Iván Darío
dc.date.accessioned2026-05-25T19:25:15Z
dc.date.available2026-05-25T19:25:15Z
dc.date.created2025-12-15
dc.identifier.urihttps://repository.unad.edu.co/handle/10596/81250
dc.description
dc.description.abstractLa planificación del sector eléctrico en Colombia depende en gran medida de la capacidad para estimar la demanda energética con precisión. Este desafío adquiere especial relevancia, en un país donde aproximadamente el 70% de la generación eléctrica proviene de fuentes hidroeléctricas, lo que hace al sistema altamente vulnerable a fenómenos climáticos como El Niño y La Niña (UPME, 2021). En este estudio, se propuso comparar el desempeño de tres modelos predictivos una extensión del modelo ARIMA (SARIMAX), Random Forest y Gradient Boosting, para proyectar la demanda mensual de energía en Colombia hasta el año 2030, utilizando datos reales del sistema interconectado nacional (SIN) sobre demanda de energía, generación de energía y demanda no atendida del periodo 2010-2023 (XM,2024) y el histórico del comportamiento de las precipitaciones en Colombia 2010-2023 (datos abiertos Colombia,2025). El proceso incluyó una fase exploratoria para identificar patrones y tendencias en los datos históricos, seguida de la implementación y ajuste de cada modelo. Se utilizaron técnicas de validación temporal para garantizar la robustez de las proyecciones y el desempeño, se evaluó mediante un conjunto de métricas ampliamente reconocidas como lo son el error absoluto medio (MAE), raíz del error cuadrático medio (RMSE), coeficiente de determinación (R²) y error porcentual absoluto medio (MAPE). Los resultados mostraron que el modelo SARIMAX con orden óptimo (1, 0, 1) x (0, 0, 2, 12), al incorporar formalmente los componentes de estacionalidad y las variables exógenas (generación, precipitación, demanda no atendida), se destacó como el más preciso en la proyección de los datos de prueba. SARIMAX capturó la tendencia creciente y los ciclos estacionales con una precisión excepcional, alcanzando un error porcentual absoluto medio (MAPE) de solo 1.37%. En claro contraste, los modelos random forest y gradient boosting demostraron ser ineficaces para capturar la compleja estructura temporal de la serie, arrojando coeficientes R^2 cercanos a cero o negativos. Estos hallazgos refuerzan la superioridad de los modelos econométricos especializados, como SARIMAX, para la predicción de la demanda energética en Colombia. Las proyecciones indican que la demanda mensual del SIN superará la barrera de los 10,000 GWh hacia finales de 2030, lo que subraya la urgencia de planificar la expansión de la oferta. El trabajo concluye entregando una herramienta validada con un MAPE del 1.37%, superior a las alternativas de Machine Learning.
dc.formatpdf
dc.titleAnálisis comparativo de modelos ARIMA, Random Forest y Gradient Boosting para la predicción de la demanda del sistema interconectado nacional colombiano (2024-2030)
dc.typeProyecto aplicado
dc.subject.keywordsDemanda de energia
dc.subject.keywordsComparacion modelos predictivos
dc.subject.keywordsArima
dc.subject.keywordsRandom Forest
dc.subject.keywordsGradient bosting
dc.description.abstractenglishThe planning of the Colombian electric sector largely depends on the ability to estimate energy demand with accuracy. This challenge acquires special relevance in a country where approximately 70% of electricity generation comes from hydroelectric sources, making the system highly vulnerable to climatic phenomena such as El Niño and La Niña (UPME, 2021). In this study, the performance of three predictive models was compared: an extension of the ARIMA model (SARIMAX), Random Forest, and Gradient Boosting, to project the monthly energy demand in Colombia until the year 2030, using real data from the National Interconnected System (SIN) regarding demand, energy generation, and unserved demand from the 2010-2023 period (XM, 2024), and the historical behavior of precipitation in Colombia (Open Data, 2025). The process included an exploratory phase to identify patterns and trends such as seasonality, followed by the implementation and adjustment of each model. Temporal validation techniques were used to ensure the robustness of the projections, and performance was evaluated using a set of widely recognized metrics such as the Mean Absolute Error (MAE), Root Mean Squared Error (RMSE), Coefficient of Determination (R^2), and Mean Absolute Percentage Error (MAPE). The results showed that the SARIMAX model with optimal order (1, 0, 1) x (0, 0, 2, 12), by formally incorporating the components of seasonality and the exogenous variables (Generation, Precipitation, Unserved Demand), stood out as the most accurate in projecting the test data. SARIMAX captured the increasing trend and the seasonal cycles with exceptional precision, achieving a Mean Absolute Percentage Error (MAPE) of only 1.37%. In stark contrast, the Random Forest and Gradient Boosting models proved ineffective at capturing the complex temporal structure of the series, yielding R^2 coefficients close to zero or negative. These findings reinforce the superiority of specialized econometric models, such as SARIMAX, for energy demand prediction in Colombia. Projections indicate that the monthly demand of the National Interconnected System (SIN) will exceed the 10,000 GWh threshold by late 2030, highlighting the urgent need for supply expansion planning. This study concludes by delivering a validated tool with a 1.37% MAPE, which outperforms the evaluated Machine Learning alternatives
dc.subject.categoryInvestigacion
Appears in Collections:Especialización en Ciencia de Datos y Analítica

Files in This Item:
File Description SizeFormat 
idrojasga.pdf704.84 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.