Mostrar el registro sencillo del ítem
Implementación de un modelo predictivo para la optimización de ventas empresariales a partir del procesamiento y análisis de datos no estructurados
| dc.contributor.advisor | Pipicano Guzmán, Felipe Alexander | |
| dc.coverage.spatial | cead_-_acacias | |
| dc.creator | Mejía Escandón, Naywa Dallys | |
| dc.creator | Cubillos Torres, Oscar Emilio | |
| dc.date.accessioned | 2025-11-06T21:02:48Z | |
| dc.date.available | 2025-11-06T21:02:48Z | |
| dc.date.created | 2025-11-06 | |
| dc.identifier.uri | https://repository.unad.edu.co/handle/10596/75778 | |
| dc.description | ||
| dc.description.abstract | El presente proyecto surgió de la necesidad crítica de optimizar las ventas de una empresa del sector comercial cuya principal dificultad era la gestión de su información. Inicialmente, los datos estaban dispersos y no estructurados en diversos formatos (imágenes, PDF, hojas de cálculo y registros manuales), lo que impedía cualquier análisis estratégico. Nuestra primera labor fue limpiar y unificar los datos utilizando herramientas como OpenRefine y Python, logrando estructurar la información para su procesamiento. Luego realizamos un análisis exploratorio que permitió identificar patrones de comportamiento comercial, canales de venta y distribución geográfica de clientes, comprendiendo así el funcionamiento diario de la empresa. Con este conocimiento, diseñamos un modelo predictivo mediante regresión supervisada en Google Colab (Python) y Pycaret. Su eficacia se potenció con el enriquecimiento de datos a través de la técnica de la ventana corrediza, incorporando variables como cliente, mes, frecuencia de compras y totales acumulados. El modelo final (Linear Regression) obtuvo métricas adecuadas (MAE, RMSE y R² de 0,8272), con un 83% de precisión predictiva. Esto brinda a la empresa una herramienta para anticipar ventas, detectar oportunidades y respaldar decisiones estratégicas, demostrando el valor de la ciencia de datos para transformar información desordenada en acciones reales con impacto positivo. Palabras clave: Datos no estructurados, Limpieza de datos, Análisis exploratorio, Modelo predictivo, Pycaret. | |
| dc.format | ||
| dc.title | Implementación de un modelo predictivo para la optimización de ventas empresariales a partir del procesamiento y análisis de datos no estructurados | |
| dc.type | Proyecto aplicado | |
| dc.subject.keywords | Datos no estructurados | |
| dc.subject.keywords | Análisis de Datos | |
| dc.subject.keywords | Limpieza de datos | |
| dc.subject.keywords | Análisis exploratorio | |
| dc.subject.keywords | Modelo predictivo | |
| dc.subject.keywords | Pycaret | |
| dc.subject.keywords | Python | |
| dc.description.abstractenglish | This project arose from the critical need to optimize sales in a commercial sector company whose main difficulty was information management. Initially, the data were scattered and unstructured across various formats (images, PDFs, spreadsheets, and manual records), making any strategic analysis impossible. Our first task was to clean and unify the data using tools such as OpenRefine and Python, successfully structuring the information for processing. We then performed an exploratory analysis that allowed us to identify commercial behavior patterns, sales channels, and the geographical distribution of clients, gaining a clear understanding of the company’s daily operations. With this knowledge, we implemented a predictive model using regression in Google Colab (Python) and PyCaret. Its effectiveness was enhanced through data enrichment with the sliding window technique, incorporating variables such as customer, month, purchase frequency, and accumulated totals. The final model (Linear Regression) achieved suitable metrics (MAE, RMSE, and R² of 0.8272) with an 83% prediction accuracy. This provides the company with a tool to anticipate sales, identify opportunities, and support strategic decision-making, demonstrating the value of data science in transforming disorganized information into real actions with a positive impact. Keywords: Unstructured data, Data cleaning, Exploratory analysis, Predictive model, PyCaret. | |
| dc.subject.category | Investigación |






















