Show simple item record

dc.contributor.advisorGarcía García, Mireya
dc.coverage.spatialcead_-_josé_celestino_mutis
dc.creatorCortes Cedula, María Isabel
dc.date.accessioned2026-03-24T17:05:32Z
dc.date.available2026-03-24T17:05:32Z
dc.date.created2025-12-07
dc.identifier.urihttps://repository.unad.edu.co/handle/10596/79665
dc.descriptionEl trabajo incluye anexos con tablas de resultados de los modelos, gráficas del método del codo y del coeficiente de silueta, mapas de calor de correlaciones, diagramas del proceso CRISP-DM, así como capturas de los tableros de inteligencia de negocios propuestos y ejemplos de código en Python utilizado para el análisis y la segmentación de clientes.
dc.description.abstractSelco Advance Control es una empresa del sector eléctrico que, después de un año de fuerte crecimiento en 2023, enfrentó en 2024 una caída cercana al 47 % en la demanda. Esta situación llevó a la organización a cuestionar la forma en que toma decisiones comerciales y a preguntarse cómo aprovechar mejor la información que ya tiene para entender a sus clientes y planear mejor su estrategia de mercado. Para el desarrollo del proyecto, la empresa entregó dos bases de datos: una de clientes y otra de ventas del año 2023. Tras normalizar el NIT e intentar unirlas en Python, solo fue posible encontrar siete registros en común, lo que puso en evidencia problemas de calidad e integración de datos. Ante este escenario, se decidió trabajar de manera exclusiva con la base de ventas 2023, que contiene 6.805 facturas y 545 clientes, y convertirla en insumo central para un modelo de inteligencia comercial. Siguiendo la metodología CRISP-DM, se construyeron indicadores RFM (Recency, Frequency, Monetary) para cada cliente y se aplicó el algoritmo K-means, validando el número de grupos con el método del codo y el coeficiente de silueta. Así se identificaron cuatro segmentos de clientes con patrones de compra claramente diferenciados. A partir de los segmentos de mayor aporte se definió una variable de “alto valor” y se entrenó en Python un modelo predictivo supervisado, utilizando regresión logística para estimar la probabilidad de que cada cliente pertenezca a los grupos más valiosos. El modelo obtuvo métricas de desempeño muy altas (exactitud superior al 95 % y AUC cercano a 0,99), lo que permitió generar un score de probabilidad de alto valor para cada cliente. La combinación entre la segmentación RFM y este modelo predictivo configura una herramienta de inteligencia comercial que ayuda a Selco Advance a priorizar sus esfuerzos de ventas, diseñar 3 acciones diferenciadas según el tipo de cliente y reducir el riesgo de concentración de ingresos en pocos actores. Palabras clave: Segmentación de mercado, inteligencia comercial, RFM, K-means, regresión logística, business intelligence.
dc.formatpdf
dc.titleInteligencia comercial mediante segmentación RFM y modelos predictivos en una empresa B2B del sector eléctrico
dc.typeProyecto aplicado
dc.subject.keywordsSegmentación de clientes
dc.subject.keywordsRFM
dc.subject.keywordsK-means
dc.subject.keywordsRegresión logística
dc.subject.keywordsInteligencia comercial
dc.subject.keywordsBusiness intelligence
dc.description.abstractenglishSelco Advance Control, a company in the electrical sector, experienced strong growth in 2023 but faced a significant decline in demand of approximately 47% during 2024. This situation prompted the organization to reassess how commercial decisions are made and how existing data could be better used to understand customer behavior and guide market strategy. For the development of this project, the company provided two datasets: a customer database and a 2023 sales database. After normalizing the NIT identifier and attempting to merge both datasets in Python, only seven matching records were found, revealing significant data quality and integration issues. As a result, the analysis focused exclusively on the 2023 sales dataset, which contains 6,805 invoices and 545 clients, transforming it into the main input for a commercial intelligence model. Following the CRISP-DM methodology, RFM indicators (Recency, Frequency, Monetary) were constructed for each client, and the K-means algorithm was applied to perform customer segmentation. The optimal number of clusters was validated using the elbow method and the silhouette coefficient, leading to the identification of four customer segments with clearly differentiated purchasing patterns. Based on the segments with the highest contribution, a “highvalue” variable was defined, and a supervised predictive model was developed in Python using logistic regression to estimate the probability that each client belongs to the most valuable groups. The model achieved high performance metrics, with accuracy above 95% and an AUC close to 0.99, allowing the generation of a high-value probability score for each client. The integration of RFM segmentation and the predictive model constitutes a commercial intelligence tool that enables Selco Advance Control to prioritize sales efforts, design differentiated strategies 5 according to customer type, and reduce the risk of revenue concentration among a limited number of clients. Keywords: Market segmentation, commercial intelligence, RFM, K-means, logistic regression, business intelligence


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record