Please use this identifier to cite or link to this item: https://repository.unad.edu.co/handle/10596/75778
Title: Implementación de un modelo predictivo para la optimización de ventas empresariales a partir del procesamiento y análisis de datos no estructurados
metadata.dc.creator: Mejía Escandón, Naywa Dallys
Cubillos Torres, Oscar Emilio
metadata.dc.date.created: 2025-11-06
metadata.dc.subject.keywords: Datos no estructurados
Análisis de Datos
Limpieza de datos
Análisis exploratorio
Modelo predictivo
Pycaret
Python
metadata.dc.format.*: pdf
metadata.dc.type: Proyecto aplicado
Abstract: El presente proyecto surgió de la necesidad crítica de optimizar las ventas de una empresa del sector comercial cuya principal dificultad era la gestión de su información. Inicialmente, los datos estaban dispersos y no estructurados en diversos formatos (imágenes, PDF, hojas de cálculo y registros manuales), lo que impedía cualquier análisis estratégico. Nuestra primera labor fue limpiar y unificar los datos utilizando herramientas como OpenRefine y Python, logrando estructurar la información para su procesamiento. Luego realizamos un análisis exploratorio que permitió identificar patrones de comportamiento comercial, canales de venta y distribución geográfica de clientes, comprendiendo así el funcionamiento diario de la empresa. Con este conocimiento, diseñamos un modelo predictivo mediante regresión supervisada en Google Colab (Python) y Pycaret. Su eficacia se potenció con el enriquecimiento de datos a través de la técnica de la ventana corrediza, incorporando variables como cliente, mes, frecuencia de compras y totales acumulados. El modelo final (Linear Regression) obtuvo métricas adecuadas (MAE, RMSE y R² de 0,8272), con un 83% de precisión predictiva. Esto brinda a la empresa una herramienta para anticipar ventas, detectar oportunidades y respaldar decisiones estratégicas, demostrando el valor de la ciencia de datos para transformar información desordenada en acciones reales con impacto positivo. Palabras clave: Datos no estructurados, Limpieza de datos, Análisis exploratorio, Modelo predictivo, Pycaret.
Description: 
URI: https://repository.unad.edu.co/handle/10596/75778
metadata.dc.subject.category: Investigación
metadata.dc.coverage.spatial: cead_-_acacias
Appears in Collections:Especialización en Ciencia de Datos y Analítica

Files in This Item:
File Description SizeFormat 
ndmejiae.pdf929.19 kBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.