Diferenciación de categorías de causas de defunción no fetal mediante aprendizaje automático e interpretación con SHAP a partir de microdatos de defunción no fetal complementados con información contextual municipal en Santander (2015–2019)
Share
Date
2026-06-11Author
Duran Acevedo, Carlos Giovanni
Advisor
Anillo Arrieta, Luis AngelCitación
Bibliographic managers
Regional / Country coverage
cead_-_bucaramangaMetadata
Show full item record
PDF Document
Description of the content
El presente estudio analiza el potencial de los registros de defunciones no fetales y de las variables sociodemográficas del Departamento Administrativo Nacional de Estadística (DANE) para modelar e interpretar patrones asociados a distintos grupos de causas de muerte en el departamento de Santander. Se clasificaron las defunciones en tres categorías: sistema circulatorio, neoplasias y externas, integrando información individual y contextual a nivel municipal. El enfoque es analítico e interpretativo, no orientado al despliegue operativo de los modelos. Para el análisis se implementaron algoritmos supervisados basados en árboles (XGBoost y CatBoost), comparados con un modelo lineal multinomial de referencia. El desempeño se evaluó mediante métricas como accuracy, precisión, recall y F1-score, incorporando validación cruzada estratificada para examinar la estabilidad de los resultados.
Posteriormente, se aplicó el método SHAP para identificar la contribución relativa de las variables en la clasificación, permitiendo identificar patrones y perfiles asociados a las categorías analizadas, así como las dificultades de diferenciación existentes entre algunas de ellas. Los hallazgos evidencian que los datos abiertos del DANE permiten construir aproximaciones estructurales útiles para el análisis territorial de la mortalidad y para apoyar la toma de decisiones en salud pública























