Show simple item record

dc.contributor.advisorPipicano Guzmán, Felipe Alexander
dc.coverage.spatialcead_-_acacias
dc.creatorMejía Escandón, Naywa Dallys
dc.creatorCubillos Torres, Oscar Emilio
dc.date.accessioned2025-11-06T21:02:48Z
dc.date.available2025-11-06T21:02:48Z
dc.date.created2025-11-06
dc.identifier.urihttps://repository.unad.edu.co/handle/10596/75778
dc.description
dc.description.abstractEl presente proyecto surgió de la necesidad crítica de optimizar las ventas de una empresa del sector comercial cuya principal dificultad era la gestión de su información. Inicialmente, los datos estaban dispersos y no estructurados en diversos formatos (imágenes, PDF, hojas de cálculo y registros manuales), lo que impedía cualquier análisis estratégico. Nuestra primera labor fue limpiar y unificar los datos utilizando herramientas como OpenRefine y Python, logrando estructurar la información para su procesamiento. Luego realizamos un análisis exploratorio que permitió identificar patrones de comportamiento comercial, canales de venta y distribución geográfica de clientes, comprendiendo así el funcionamiento diario de la empresa. Con este conocimiento, diseñamos un modelo predictivo mediante regresión supervisada en Google Colab (Python) y Pycaret. Su eficacia se potenció con el enriquecimiento de datos a través de la técnica de la ventana corrediza, incorporando variables como cliente, mes, frecuencia de compras y totales acumulados. El modelo final (Linear Regression) obtuvo métricas adecuadas (MAE, RMSE y R² de 0,8272), con un 83% de precisión predictiva. Esto brinda a la empresa una herramienta para anticipar ventas, detectar oportunidades y respaldar decisiones estratégicas, demostrando el valor de la ciencia de datos para transformar información desordenada en acciones reales con impacto positivo. Palabras clave: Datos no estructurados, Limpieza de datos, Análisis exploratorio, Modelo predictivo, Pycaret.
dc.formatpdf
dc.titleImplementación de un modelo predictivo para la optimización de ventas empresariales a partir del procesamiento y análisis de datos no estructurados
dc.typeProyecto aplicado
dc.subject.keywordsDatos no estructurados
dc.subject.keywordsAnálisis de Datos
dc.subject.keywordsLimpieza de datos
dc.subject.keywordsAnálisis exploratorio
dc.subject.keywordsModelo predictivo
dc.subject.keywordsPycaret
dc.subject.keywordsPython
dc.description.abstractenglishThis project arose from the critical need to optimize sales in a commercial sector company whose main difficulty was information management. Initially, the data were scattered and unstructured across various formats (images, PDFs, spreadsheets, and manual records), making any strategic analysis impossible. Our first task was to clean and unify the data using tools such as OpenRefine and Python, successfully structuring the information for processing. We then performed an exploratory analysis that allowed us to identify commercial behavior patterns, sales channels, and the geographical distribution of clients, gaining a clear understanding of the company’s daily operations. With this knowledge, we implemented a predictive model using regression in Google Colab (Python) and PyCaret. Its effectiveness was enhanced through data enrichment with the sliding window technique, incorporating variables such as customer, month, purchase frequency, and accumulated totals. The final model (Linear Regression) achieved suitable metrics (MAE, RMSE, and R² of 0.8272) with an 83% prediction accuracy. This provides the company with a tool to anticipate sales, identify opportunities, and support strategic decision-making, demonstrating the value of data science in transforming disorganized information into real actions with a positive impact. Keywords: Unstructured data, Data cleaning, Exploratory analysis, Predictive model, PyCaret.
dc.subject.categoryInvestigación


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record