Please use this identifier to cite or link to this item:
https://repository.unad.edu.co/handle/10596/78091| Title: | Identificación de perfiles clínicos en pacientes con obesidad mediante clustering difuso y análisis de consistencia estadística |
| metadata.dc.creator: | Varilla Mendoza, Fernando Arturo |
| metadata.dc.date.created: | 2025-05-06 |
| metadata.dc.subject.keywords: | C-means Fuzzy clustering Incertidumbre Obesidad Lógica difusa |
| metadata.dc.format.*: | |
| metadata.dc.type: | Proyecto aplicado |
| Abstract: | El presente trabajo tiene como objetivo caracterizar perfiles clínicos en pacientes con obesidad mediante la aplicación de técnicas de agrupamiento difuso, específicamente el algoritmo Fuzzy C-Means (FCM) desde un enfoque estadístico. Para esto, se utilizó un conjunto de datos clínicos recolectados de pacientes con diagnóstico de obesidad en la ciudad de Bogota-Colombia durante el periodo 2024, la cual incluye variables bioquímicas y antropométricas relevantes como índice de masa corporal (IMC), edad, peso, talla y variables simuladas seleccionadas de acuerdo con la literatura tales como niveles de glucosa en ayunas, HbA1c, lípidos, entre otros. Como parte del desarrollo se realizó un análisis preliminar que incluyó estadísticas descriptivas y un análisis de Correspondencias Múltiples (ACM), con el fin de explorar la estructura subyacente de las variables numéricas y categóricas y así enriquecer la interpretación de los clústeres obtenidos. Posteriormente, se examinó la correlación entre variables con el propósito de identificar relaciones estructurales y seleccionar la medida de distancia más adecuada. Se identificaron dos clusters con perfiles claramente diferenciados, donde el grupo 2 mostró un mayor riesgo asociado a obesidad con una edad promedio de 60 años y constituido por mujeres, evidenciado por un índice de masa corporal (IMC) significativamente más alto. Este grupo también presentó mayores niveles de glucosa en ayunas y HbA1c, indicadores relacionados con posibles condiciones de prediabetes. El grupo 1, por su parte, presentó niveles más bajos de IMC, edad promedio de 65 años, sugiriendo un perfil de riesgo moderado de enfermedades relacionadas a la obesidad. Las métricas de desempeño del modelo indicaron una partición aceptable y consistente con el enfoque fuzzy, que permite solapamiento entre grupos. Entre ellas encontramos el Índice de Silueta Difuso, que indica una calidad de partición moderadamente buena, lo que sugiere una separación aceptable entre los clústeres. El Coeficiente de Partición de 0.69 y el Coeficiente de Partición Modificado de 0.38 respaldan una estructura de clústeres definida, aunque con cierto grado de traslapamiento, característico de este tipo de metodologías basadas en incertidumbre. Asimismo, la Entropía de Partición de 0.47 refleja un nivel medio de ambigüedad en la asignación de los datos a los clústeres. |
| Description: | |
| URI: | https://repository.unad.edu.co/handle/10596/78091 |
| metadata.dc.subject.category: | Investigación |
| metadata.dc.coverage.spatial: | ccav_-_sahagún |
| Appears in Collections: | Especialización en Ciencia de Datos y Analítica |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| favarillam.pdf | 514.43 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.