Aplicación de modelo predictivo para análisis de ventas aplicado a una cafetería mediante la implementación de técnicas de aprendizaje automático y series temporales (Machine Learning)

Alarcón García, Germán Danilo; Martínez Cardozo, Diego Andrés

dc.contributor.advisor	Mejía Manzano, Julio Eduardo
dc.coverage.spatial	cead_-_facatativa
dc.creator	Alarcón García, Germán Danilo
dc.creator	Martínez Cardozo, Diego Andrés
dc.date.accessioned	2026-02-05T15:47:21Z
dc.date.available	2026-02-05T15:47:21Z
dc.date.created	2025-12-19
dc.identifier.uri	https://repository.unad.edu.co/handle/10596/78463
dc.description.abstract	Este proyecto de grado, desarrollado por Diego Martínez y Germán Danilo Alarcón para la Especialización en Ciencia de Datos de la UNAD (2025), aborda la falta de herramientas predictivas en cafeterías familiares colombianas, un problema que genera desperdicios por sobreproducción o pérdidas por desabastecimiento. Para resolverlo, aplicaron la metodología SEMMA combinando modelos de series temporales (ARIMA) con algoritmos de aprendizaje automático (Regresión Lineal y Random Forest), analizando 65,193 transacciones registradas durante 111 días. Los resultados demostraron que los modelos de Machine Learning superaron significativamente a ARIMA: la Regresión Lineal alcanzó un R² perfecto de 1.000 para predicción de cantidad, mientras que Random Forest logró un R² de 0.978 para ingresos; en contraste, ARIMA obtuvo valores negativos de R², evidenciando su incapacidad para capturar patrones complejos. El trabajo concluye que es viable implementar metodologías de ciencia de datos en pequeños negocios para optimizar inventarios, planificar personal y reducir desperdicios, permitiéndoles competir mediante decisiones basadas en datos.
dc.format	pdf
dc.title	Aplicación de modelo predictivo para análisis de ventas aplicado a una cafetería mediante la implementación de técnicas de aprendizaje automático y series temporales (Machine Learning)
dc.type	Proyecto aplicado
dc.subject.keywords	Predicción de ventas
dc.subject.keywords	Machine Learning
dc.subject.keywords	Series temporales
dc.subject.keywords	ARIMA
dc.subject.keywords	Random Forest
dc.subject.keywords	Estacionalidad
dc.subject.keywords	Metodología SEMMA
dc.subject.keywords	Análisis de datos
dc.subject.keywords	Optimización
dc.subject.keywords	Minería de datos
dc.description.abstractenglish	This graduation project, developed by Diego Martínez and Germán Danilo Alarcón for the Data Science Specialization at UNAD (2025), addresses the lack of predictive tools in Colombian family-owned cafés, a problem that leads to waste from overproduction or losses from stockouts. To solve this, they applied the SEMMA methodology combining time series models (ARIMA) with machine learning algorithms (Linear Regression and Random Forest), analyzing 65,193 transactions recorded over 111 days. The results demonstrated that Machine Learning models significantly outperformed ARIMA: Linear Regression achieved a perfect R² of 1.000 for quantity prediction, while Random Forest reached an R² of 0.978 for revenue; in contrast, ARIMA obtained negative R² values, evidencing its inability to capture complex patterns. The study concludes that implementing data science methodologies in small businesses is feasible for optimizing inventory, planning staff, and reducing waste, enabling them to compete through data-driven decisions.
dc.subject.category	Ciencia de Datos y Analítica
dc.subject.category	Machine Learning