| dc.contributor.advisor | Mejía Manzano, Julio Eduardo | |
| dc.coverage.spatial | cead_-_facatativa | |
| dc.creator | Alarcón García, Germán Danilo | |
| dc.creator | Martínez Cardozo, Diego Andrés | |
| dc.date.accessioned | 2026-02-05T15:47:21Z | |
| dc.date.available | 2026-02-05T15:47:21Z | |
| dc.date.created | 2025-12-19 | |
| dc.identifier.uri | https://repository.unad.edu.co/handle/10596/78463 | |
| dc.description.abstract | Este proyecto de grado, desarrollado por Diego Martínez y Germán Danilo Alarcón para la Especialización en Ciencia de Datos de la UNAD (2025), aborda la falta de herramientas predictivas en cafeterías familiares colombianas, un problema que genera desperdicios por sobreproducción o pérdidas por desabastecimiento. Para resolverlo, aplicaron la metodología SEMMA combinando modelos de series temporales (ARIMA) con algoritmos de aprendizaje automático (Regresión Lineal y Random Forest), analizando 65,193 transacciones registradas durante 111 días. Los resultados demostraron que los modelos de Machine Learning superaron significativamente a ARIMA: la Regresión Lineal alcanzó un R² perfecto de 1.000 para predicción de cantidad, mientras que Random Forest logró un R² de 0.978 para ingresos; en contraste, ARIMA obtuvo valores negativos de R², evidenciando su incapacidad para capturar patrones complejos. El trabajo concluye que es viable implementar metodologías de ciencia de datos en pequeños negocios para optimizar inventarios, planificar personal y reducir desperdicios, permitiéndoles competir mediante decisiones basadas en datos. | |
| dc.format | pdf | |
| dc.title | Aplicación de modelo predictivo para análisis de ventas aplicado a una cafetería mediante la implementación de técnicas de aprendizaje automático y series temporales (Machine Learning) | |
| dc.type | Proyecto aplicado | |
| dc.subject.keywords | Predicción de ventas | |
| dc.subject.keywords | Machine Learning | |
| dc.subject.keywords | Series temporales | |
| dc.subject.keywords | ARIMA | |
| dc.subject.keywords | Random Forest | |
| dc.subject.keywords | Estacionalidad | |
| dc.subject.keywords | Metodología SEMMA | |
| dc.subject.keywords | Análisis de datos | |
| dc.subject.keywords | Optimización | |
| dc.subject.keywords | Minería de datos | |
| dc.description.abstractenglish | This graduation project, developed by Diego Martínez and Germán Danilo Alarcón for the Data Science Specialization at UNAD (2025), addresses the lack of predictive tools in Colombian family-owned cafés, a problem that leads to waste from overproduction or losses from stockouts. To solve this, they applied the SEMMA methodology combining time series models (ARIMA) with machine learning algorithms (Linear Regression and Random Forest), analyzing 65,193 transactions recorded over 111 days. The results demonstrated that Machine Learning models significantly outperformed ARIMA: Linear Regression achieved a perfect R² of 1.000 for quantity prediction, while Random Forest reached an R² of 0.978 for revenue; in contrast, ARIMA obtained negative R² values, evidencing its inability to capture complex patterns. The study concludes that implementing data science methodologies in small businesses is feasible for optimizing inventory, planning staff, and reducing waste, enabling them to compete through data-driven decisions. | |
| dc.subject.category | Ciencia de Datos y Analítica | |
| dc.subject.category | Machine Learning | |