| dc.contributor.advisor | García García, Mireya | |
| dc.coverage.spatial | cead_-_josé_celestino_mutis | |
| dc.creator | Cortes Cedula, María Isabel | |
| dc.date.accessioned | 2026-03-24T17:05:32Z | |
| dc.date.available | 2026-03-24T17:05:32Z | |
| dc.date.created | 2025-12-07 | |
| dc.identifier.uri | https://repository.unad.edu.co/handle/10596/79665 | |
| dc.description | El trabajo incluye anexos con tablas de resultados de los modelos, gráficas del método del codo y del coeficiente de silueta, mapas de calor de correlaciones, diagramas del proceso CRISP-DM, así como capturas de los tableros de inteligencia de negocios propuestos y ejemplos de código en Python utilizado para el análisis y la segmentación de clientes. | |
| dc.description.abstract | Selco Advance Control es una empresa del sector eléctrico que, después de un año de
fuerte crecimiento en 2023, enfrentó en 2024 una caída cercana al 47 % en la demanda. Esta
situación llevó a la organización a cuestionar la forma en que toma decisiones comerciales y a
preguntarse cómo aprovechar mejor la información que ya tiene para entender a sus clientes y
planear mejor su estrategia de mercado.
Para el desarrollo del proyecto, la empresa entregó dos bases de datos: una de clientes y
otra de ventas del año 2023. Tras normalizar el NIT e intentar unirlas en Python, solo fue posible
encontrar siete registros en común, lo que puso en evidencia problemas de calidad e integración
de datos. Ante este escenario, se decidió trabajar de manera exclusiva con la base de ventas
2023, que contiene 6.805 facturas y 545 clientes, y convertirla en insumo central para un modelo
de inteligencia comercial.
Siguiendo la metodología CRISP-DM, se construyeron indicadores RFM (Recency,
Frequency, Monetary) para cada cliente y se aplicó el algoritmo K-means, validando el número
de grupos con el método del codo y el coeficiente de silueta. Así se identificaron cuatro
segmentos de clientes con patrones de compra claramente diferenciados. A partir de los
segmentos de mayor aporte se definió una variable de “alto valor” y se entrenó en Python un
modelo predictivo supervisado, utilizando regresión logística para estimar la probabilidad de que
cada cliente pertenezca a los grupos más valiosos.
El modelo obtuvo métricas de desempeño muy altas (exactitud superior al 95 % y AUC
cercano a 0,99), lo que permitió generar un score de probabilidad de alto valor para cada cliente.
La combinación entre la segmentación RFM y este modelo predictivo configura una herramienta
de inteligencia comercial que ayuda a Selco Advance a priorizar sus esfuerzos de ventas, diseñar
3
acciones diferenciadas según el tipo de cliente y reducir el riesgo de concentración de ingresos
en pocos actores.
Palabras clave: Segmentación de mercado, inteligencia comercial, RFM, K-means,
regresión logística, business intelligence. | |
| dc.format | pdf | |
| dc.title | Inteligencia comercial mediante segmentación RFM y modelos predictivos en una empresa B2B del sector eléctrico | |
| dc.type | Proyecto aplicado | |
| dc.subject.keywords | Segmentación de clientes | |
| dc.subject.keywords | RFM | |
| dc.subject.keywords | K-means | |
| dc.subject.keywords | Regresión logística | |
| dc.subject.keywords | Inteligencia comercial | |
| dc.subject.keywords | Business intelligence | |
| dc.description.abstractenglish | Selco Advance Control, a company in the electrical sector, experienced strong growth in
2023 but faced a significant decline in demand of approximately 47% during 2024. This situation
prompted the organization to reassess how commercial decisions are made and how existing data
could be better used to understand customer behavior and guide market strategy.
For the development of this project, the company provided two datasets: a customer
database and a 2023 sales database. After normalizing the NIT identifier and attempting to merge
both datasets in Python, only seven matching records were found, revealing significant data
quality and integration issues. As a result, the analysis focused exclusively on the 2023 sales
dataset, which contains 6,805 invoices and 545 clients, transforming it into the main input for a
commercial intelligence model.
Following the CRISP-DM methodology, RFM indicators (Recency, Frequency,
Monetary) were constructed for each client, and the K-means algorithm was applied to perform
customer segmentation. The optimal number of clusters was validated using the elbow method
and the silhouette coefficient, leading to the identification of four customer segments with clearly
differentiated purchasing patterns. Based on the segments with the highest contribution, a “highvalue” variable was defined, and a supervised predictive model was developed in Python using
logistic regression to estimate the probability that each client belongs to the most valuable
groups.
The model achieved high performance metrics, with accuracy above 95% and an AUC
close to 0.99, allowing the generation of a high-value probability score for each client. The
integration of RFM segmentation and the predictive model constitutes a commercial intelligence
tool that enables Selco Advance Control to prioritize sales efforts, design differentiated strategies
5
according to customer type, and reduce the risk of revenue concentration among a limited
number of clients.
Keywords: Market segmentation, commercial intelligence, RFM, K-means, logistic
regression, business intelligence | |