Implementación de un modelo predictivo para la optimización de ventas empresariales a partir del procesamiento y análisis de datos no estructurados
Share
Date
2025-11-06Author
Mejía Escandón, Naywa Dallys
Cubillos Torres, Oscar Emilio
Citación
Bibliographic managers
Keywords
Regional / Country coverage
cead_-_acaciasMetadata
Show full item record
PDF Document
Description of the content
El presente proyecto surgió de la necesidad crítica de optimizar las ventas de una empresa
del sector comercial cuya principal dificultad era la gestión de su información. Inicialmente, los
datos estaban dispersos y no estructurados en diversos formatos (imágenes, PDF, hojas de
cálculo y registros manuales), lo que impedía cualquier análisis estratégico. Nuestra primera
labor fue limpiar y unificar los datos utilizando herramientas como OpenRefine y Python,
logrando estructurar la información para su procesamiento. Luego realizamos un análisis
exploratorio que permitió identificar patrones de comportamiento comercial, canales de venta y
distribución geográfica de clientes, comprendiendo así el funcionamiento diario de la empresa.
Con este conocimiento, diseñamos un modelo predictivo mediante regresión supervisada
en Google Colab (Python) y Pycaret. Su eficacia se potenció con el enriquecimiento de datos a
través de la técnica de la ventana corrediza, incorporando variables como cliente, mes, frecuencia
de compras y totales acumulados. El modelo final (Linear Regression) obtuvo métricas
adecuadas (MAE, RMSE y R² de 0,8272), con un 83% de precisión predictiva. Esto brinda a la
empresa una herramienta para anticipar ventas, detectar oportunidades y respaldar decisiones
estratégicas, demostrando el valor de la ciencia de datos para transformar información
desordenada en acciones reales con impacto positivo.
Palabras clave: Datos no estructurados, Limpieza de datos, Análisis exploratorio, Modelo
predictivo, Pycaret.























