Identificación de perfiles clínicos en pacientes con obesidad mediante clustering difuso y análisis de consistencia estadística

Varilla Mendoza, Fernando Arturo

dc.contributor.advisor	Mejía Manzano, Julio Eduardo
dc.coverage.spatial	ccav_-_sahagún
dc.creator	Varilla Mendoza, Fernando Arturo
dc.date.accessioned	2026-01-13T20:13:24Z
dc.date.available	2026-01-13T20:13:24Z
dc.date.created	2025-05-06
dc.identifier.uri	https://repository.unad.edu.co/handle/10596/78091
dc.description
dc.description.abstract	El presente trabajo tiene como objetivo caracterizar perfiles clínicos en pacientes con obesidad mediante la aplicación de técnicas de agrupamiento difuso, específicamente el algoritmo Fuzzy C-Means (FCM) desde un enfoque estadístico. Para esto, se utilizó un conjunto de datos clínicos recolectados de pacientes con diagnóstico de obesidad en la ciudad de Bogota-Colombia durante el periodo 2024, la cual incluye variables bioquímicas y antropométricas relevantes como índice de masa corporal (IMC), edad, peso, talla y variables simuladas seleccionadas de acuerdo con la literatura tales como niveles de glucosa en ayunas, HbA1c, lípidos, entre otros. Como parte del desarrollo se realizó un análisis preliminar que incluyó estadísticas descriptivas y un análisis de Correspondencias Múltiples (ACM), con el fin de explorar la estructura subyacente de las variables numéricas y categóricas y así enriquecer la interpretación de los clústeres obtenidos. Posteriormente, se examinó la correlación entre variables con el propósito de identificar relaciones estructurales y seleccionar la medida de distancia más adecuada. Se identificaron dos clusters con perfiles claramente diferenciados, donde el grupo 2 mostró un mayor riesgo asociado a obesidad con una edad promedio de 60 años y constituido por mujeres, evidenciado por un índice de masa corporal (IMC) significativamente más alto. Este grupo también presentó mayores niveles de glucosa en ayunas y HbA1c, indicadores relacionados con posibles condiciones de prediabetes. El grupo 1, por su parte, presentó niveles más bajos de IMC, edad promedio de 65 años, sugiriendo un perfil de riesgo moderado de enfermedades relacionadas a la obesidad. Las métricas de desempeño del modelo indicaron una partición aceptable y consistente con el enfoque fuzzy, que permite solapamiento entre grupos. Entre ellas encontramos el Índice de Silueta Difuso, que indica una calidad de partición moderadamente buena, lo que sugiere una separación aceptable entre los clústeres. El Coeficiente de Partición de 0.69 y el Coeficiente de Partición Modificado de 0.38 respaldan una estructura de clústeres definida, aunque con cierto grado de traslapamiento, característico de este tipo de metodologías basadas en incertidumbre. Asimismo, la Entropía de Partición de 0.47 refleja un nivel medio de ambigüedad en la asignación de los datos a los clústeres.
dc.format	pdf
dc.title	Identificación de perfiles clínicos en pacientes con obesidad mediante clustering difuso y análisis de consistencia estadística
dc.type	Proyecto aplicado
dc.subject.keywords	C-means
dc.subject.keywords	Fuzzy clustering
dc.subject.keywords	Incertidumbre
dc.subject.keywords	Obesidad
dc.subject.keywords	Lógica difusa
dc.description.abstractenglish	The present work aims to characterize clinical profiles in patients with obesity by applying fuzzy clustering techniques, specifically the Fuzzy C-Means (FCM) algorithm from a statistical perspective. To this end, a clinical dataset collected from patients diagnosed with obesity in the city of Bogotá, Colombia, during the period from 2024 to 2024 was used. This dataset includes relevant biochemical and anthropometric variables such as body mass index (BMI), age, weight, height, and simulated variables selected from the literature, such as fasting glucose levels, HbA1c, lipids, among others. As part of the development, a preliminary analysis was performed, including descriptive statistics and a Multiple Correspondence Analysis (MCA), to explore the underlying structure of the numerical and categorical variables and thus enrich the interpretation of the clusters obtained. Subsequently, the evaluation between variables is examined to identify structural relationships and select the most appropriate distance measure. Two clusters with clearly differentiated profiles were identified. Group 2 showed a higher risk of obesity, with an average age of 60 years and comprised of women, as evidenced by a significantly higher body mass index (BMI). This group also had higher levels of fasting glucose and HbA1c, indicators associated with possible prediabetes. Group 1, on the other hand, had lower BMI levels and an average age of 65 years, suggesting a moderate risk profile for obesity-related diseases. The model's performance metrics indicated an acceptable partitioning consistent with the fuzzy approach, which allows for overlap between groups.shows these metrics, including the Fuzzy Silhouette Index, which indicates moderately good partitioning quality, suggesting acceptable separation between clusters. The Partition Coefficient of 0.69 and the Modified Partition Coefficient of 0.38 support a defined cluster structure, albeit with a certain degree of overlap, characteristic of this type of uncertainty-based methodologies. Furthermore, the Partition Entropy of 0.47 reflects a medium level of ambiguity in the assignment of data to clusters.
dc.subject.category	Investigación