Please use this identifier to cite or link to this item:
https://repository.unad.edu.co/handle/10596/82370| Title: | Diferenciación de categorías de causas de defunción no fetal mediante aprendizaje automático e interpretación con SHAP a partir de microdatos de defunción no fetal complementados con información contextual municipal en Santander (2015–2019) |
| metadata.dc.creator: | Duran Acevedo, Carlos Giovanni |
| metadata.dc.date.created: | 2026-06-11 |
| metadata.dc.subject.keywords: | Aprendizaje automatico SHAP Mortalidad no fetal |
| metadata.dc.format.*: | |
| metadata.dc.type: | Proyecto de investigación |
| Abstract: | El presente estudio analiza el potencial de los registros de defunciones no fetales y de las variables sociodemográficas del Departamento Administrativo Nacional de Estadística (DANE) para modelar e interpretar patrones asociados a distintos grupos de causas de muerte en el departamento de Santander. Se clasificaron las defunciones en tres categorías: sistema circulatorio, neoplasias y externas, integrando información individual y contextual a nivel municipal. El enfoque es analítico e interpretativo, no orientado al despliegue operativo de los modelos. Para el análisis se implementaron algoritmos supervisados basados en árboles (XGBoost y CatBoost), comparados con un modelo lineal multinomial de referencia. El desempeño se evaluó mediante métricas como accuracy, precisión, recall y F1-score, incorporando validación cruzada estratificada para examinar la estabilidad de los resultados. Posteriormente, se aplicó el método SHAP para identificar la contribución relativa de las variables en la clasificación, permitiendo identificar patrones y perfiles asociados a las categorías analizadas, así como las dificultades de diferenciación existentes entre algunas de ellas. Los hallazgos evidencian que los datos abiertos del DANE permiten construir aproximaciones estructurales útiles para el análisis territorial de la mortalidad y para apoyar la toma de decisiones en salud pública |
| Description: | Los anexos presentan la descripción de los códigos empleados en las variables analizadas, incluyendo la codificación de variables categóricas transformadas a dicotómicas, grupos etarios y niveles educativos, con el fin de facilitar la interpretación de la información utilizada en el estudio |
| URI: | https://repository.unad.edu.co/handle/10596/82370 |
| metadata.dc.subject.category: | Ciencia de Datos y Analítica |
| metadata.dc.coverage.spatial: | cead_-_bucaramanga |
| Appears in Collections: | Maestría en Ciencia de Datos y Analítica |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| cgdurana.pdf | 1.48 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.