| dc.contributor.advisor | Pipicano Guzmán, Felipe Alexander | |
| dc.coverage.spatial | cead_-_acacias | |
| dc.creator | Mejía Escandón, Naywa Dallys | |
| dc.creator | Cubillos Torres, Oscar Emilio | |
| dc.date.accessioned | 2025-11-06T21:02:48Z | |
| dc.date.available | 2025-11-06T21:02:48Z | |
| dc.date.created | 2025-11-06 | |
| dc.identifier.uri | https://repository.unad.edu.co/handle/10596/75778 | |
| dc.description | | |
| dc.description.abstract | El presente proyecto surgió de la necesidad crítica de optimizar las ventas de una empresa
del sector comercial cuya principal dificultad era la gestión de su información. Inicialmente, los
datos estaban dispersos y no estructurados en diversos formatos (imágenes, PDF, hojas de
cálculo y registros manuales), lo que impedía cualquier análisis estratégico. Nuestra primera
labor fue limpiar y unificar los datos utilizando herramientas como OpenRefine y Python,
logrando estructurar la información para su procesamiento. Luego realizamos un análisis
exploratorio que permitió identificar patrones de comportamiento comercial, canales de venta y
distribución geográfica de clientes, comprendiendo así el funcionamiento diario de la empresa.
Con este conocimiento, diseñamos un modelo predictivo mediante regresión supervisada
en Google Colab (Python) y Pycaret. Su eficacia se potenció con el enriquecimiento de datos a
través de la técnica de la ventana corrediza, incorporando variables como cliente, mes, frecuencia
de compras y totales acumulados. El modelo final (Linear Regression) obtuvo métricas
adecuadas (MAE, RMSE y R² de 0,8272), con un 83% de precisión predictiva. Esto brinda a la
empresa una herramienta para anticipar ventas, detectar oportunidades y respaldar decisiones
estratégicas, demostrando el valor de la ciencia de datos para transformar información
desordenada en acciones reales con impacto positivo.
Palabras clave: Datos no estructurados, Limpieza de datos, Análisis exploratorio, Modelo
predictivo, Pycaret. | |
| dc.format | pdf | |
| dc.title | Implementación de un modelo predictivo para la optimización de ventas empresariales a partir del procesamiento y análisis de datos no estructurados | |
| dc.type | Proyecto aplicado | |
| dc.subject.keywords | Datos no estructurados | |
| dc.subject.keywords | Análisis de Datos | |
| dc.subject.keywords | Limpieza de datos | |
| dc.subject.keywords | Análisis exploratorio | |
| dc.subject.keywords | Modelo predictivo | |
| dc.subject.keywords | Pycaret | |
| dc.subject.keywords | Python | |
| dc.description.abstractenglish | This project arose from the critical need to optimize sales in a commercial sector
company whose main difficulty was information management. Initially, the data were scattered
and unstructured across various formats (images, PDFs, spreadsheets, and manual records),
making any strategic analysis impossible. Our first task was to clean and unify the data using
tools such as OpenRefine and Python, successfully structuring the information for processing.
We then performed an exploratory analysis that allowed us to identify commercial behavior
patterns, sales channels, and the geographical distribution of clients, gaining a clear
understanding of the company’s daily operations.
With this knowledge, we implemented a predictive model using regression in Google
Colab (Python) and PyCaret. Its effectiveness was enhanced through data enrichment with the
sliding window technique, incorporating variables such as customer, month, purchase frequency,
and accumulated totals. The final model (Linear Regression) achieved suitable metrics (MAE,
RMSE, and R² of 0.8272) with an 83% prediction accuracy. This provides the company with a
tool to anticipate sales, identify opportunities, and support strategic decision-making,
demonstrating the value of data science in transforming disorganized information into real
actions with a positive impact.
Keywords: Unstructured data, Data cleaning, Exploratory analysis, Predictive model,
PyCaret. | |
| dc.subject.category | Investigación | |