Mostrar el registro sencillo del ítem
Diferenciación de categorías de causas de defunción no fetal mediante aprendizaje automático e interpretación con SHAP a partir de microdatos de defunción no fetal complementados con información contextual municipal en Santander (2015–2019)
| dc.contributor.advisor | Anillo Arrieta, Luis Angel | |
| dc.coverage.spatial | cead_-_bucaramanga | |
| dc.creator | Duran Acevedo, Carlos Giovanni | |
| dc.date.accessioned | 2026-06-18T19:37:21Z | |
| dc.date.available | 2026-06-18T19:37:21Z | |
| dc.date.created | 2026-06-11 | |
| dc.identifier.uri | https://repository.unad.edu.co/handle/10596/82370 | |
| dc.description | Los anexos presentan la descripción de los códigos empleados en las variables analizadas, incluyendo la codificación de variables categóricas transformadas a dicotómicas, grupos etarios y niveles educativos, con el fin de facilitar la interpretación de la información utilizada en el estudio | |
| dc.description.abstract | El presente estudio analiza el potencial de los registros de defunciones no fetales y de las variables sociodemográficas del Departamento Administrativo Nacional de Estadística (DANE) para modelar e interpretar patrones asociados a distintos grupos de causas de muerte en el departamento de Santander. Se clasificaron las defunciones en tres categorías: sistema circulatorio, neoplasias y externas, integrando información individual y contextual a nivel municipal. El enfoque es analítico e interpretativo, no orientado al despliegue operativo de los modelos. Para el análisis se implementaron algoritmos supervisados basados en árboles (XGBoost y CatBoost), comparados con un modelo lineal multinomial de referencia. El desempeño se evaluó mediante métricas como accuracy, precisión, recall y F1-score, incorporando validación cruzada estratificada para examinar la estabilidad de los resultados. Posteriormente, se aplicó el método SHAP para identificar la contribución relativa de las variables en la clasificación, permitiendo identificar patrones y perfiles asociados a las categorías analizadas, así como las dificultades de diferenciación existentes entre algunas de ellas. Los hallazgos evidencian que los datos abiertos del DANE permiten construir aproximaciones estructurales útiles para el análisis territorial de la mortalidad y para apoyar la toma de decisiones en salud pública | |
| dc.format | ||
| dc.title | Diferenciación de categorías de causas de defunción no fetal mediante aprendizaje automático e interpretación con SHAP a partir de microdatos de defunción no fetal complementados con información contextual municipal en Santander (2015–2019) | |
| dc.type | Proyecto de investigación | |
| dc.subject.keywords | Aprendizaje automatico | |
| dc.subject.keywords | SHAP | |
| dc.subject.keywords | Mortalidad no fetal | |
| dc.description.abstractenglish | This study analyzes the potential of non-fetal death records and sociodemographic variables provided by the National Administrative Department of Statistics (DANE) to model and interpret patterns associated with different groups of causes of death in the department of Santander. Deaths were classified into three categories: circulatory system diseases, neoplasms, and external causes, integrating individual-level and municipal-level contextual information. The study adopted an analytical and interpretative approach rather than focusing on the operational deployment of predictive models. For the analysis, supervised tree-based algorithms (XGBoost and CatBoost) were implemented and compared with a multinomial logistic regression model used as a baseline. Model performance was evaluated using metrics such as accuracy, precision, recall, and F1-score, incorporating stratified cross-validation to assess the stability of the results. Subsequently, the SHAP method was applied to identify the relative contribution of the variables to the classification process, enabling the identification of patterns and profiles associated with the analyzed categories, as well as the difficulties in differentiating some of them. The findings show that DANE's open-access microdata provide useful structural approximations for territorial mortality analysis and can support decision-making processes in public health. | |
| dc.subject.category | Ciencia de Datos y Analítica |





















