Please use this identifier to cite or link to this item:
https://repository.unad.edu.co/handle/10596/81250| Title: | Análisis comparativo de modelos ARIMA, Random Forest y Gradient Boosting para la predicción de la demanda del sistema interconectado nacional colombiano (2024-2030) |
| metadata.dc.creator: | Rojas Galvis, Iván Darío |
| metadata.dc.date.created: | 2025-12-15 |
| metadata.dc.subject.keywords: | Demanda de energia Comparacion modelos predictivos Arima Random Forest Gradient bosting |
| metadata.dc.format.*: | |
| metadata.dc.type: | Proyecto aplicado |
| Abstract: | La planificación del sector eléctrico en Colombia depende en gran medida de la capacidad para estimar la demanda energética con precisión. Este desafío adquiere especial relevancia, en un país donde aproximadamente el 70% de la generación eléctrica proviene de fuentes hidroeléctricas, lo que hace al sistema altamente vulnerable a fenómenos climáticos como El Niño y La Niña (UPME, 2021). En este estudio, se propuso comparar el desempeño de tres modelos predictivos una extensión del modelo ARIMA (SARIMAX), Random Forest y Gradient Boosting, para proyectar la demanda mensual de energía en Colombia hasta el año 2030, utilizando datos reales del sistema interconectado nacional (SIN) sobre demanda de energía, generación de energía y demanda no atendida del periodo 2010-2023 (XM,2024) y el histórico del comportamiento de las precipitaciones en Colombia 2010-2023 (datos abiertos Colombia,2025). El proceso incluyó una fase exploratoria para identificar patrones y tendencias en los datos históricos, seguida de la implementación y ajuste de cada modelo. Se utilizaron técnicas de validación temporal para garantizar la robustez de las proyecciones y el desempeño, se evaluó mediante un conjunto de métricas ampliamente reconocidas como lo son el error absoluto medio (MAE), raíz del error cuadrático medio (RMSE), coeficiente de determinación (R²) y error porcentual absoluto medio (MAPE). Los resultados mostraron que el modelo SARIMAX con orden óptimo (1, 0, 1) x (0, 0, 2, 12), al incorporar formalmente los componentes de estacionalidad y las variables exógenas (generación, precipitación, demanda no atendida), se destacó como el más preciso en la proyección de los datos de prueba. SARIMAX capturó la tendencia creciente y los ciclos estacionales con una precisión excepcional, alcanzando un error porcentual absoluto medio (MAPE) de solo 1.37%. En claro contraste, los modelos random forest y gradient boosting demostraron ser ineficaces para capturar la compleja estructura temporal de la serie, arrojando coeficientes R^2 cercanos a cero o negativos. Estos hallazgos refuerzan la superioridad de los modelos econométricos especializados, como SARIMAX, para la predicción de la demanda energética en Colombia. Las proyecciones indican que la demanda mensual del SIN superará la barrera de los 10,000 GWh hacia finales de 2030, lo que subraya la urgencia de planificar la expansión de la oferta. El trabajo concluye entregando una herramienta validada con un MAPE del 1.37%, superior a las alternativas de Machine Learning. |
| Description: | |
| URI: | https://repository.unad.edu.co/handle/10596/81250 |
| metadata.dc.subject.category: | Investigacion |
| metadata.dc.coverage.spatial: | cead_-_la_dorada |
| Appears in Collections: | Especialización en Ciencia de Datos y Analítica |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| idrojasga.pdf | 704.84 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.