Please use this identifier to cite or link to this item:
https://repository.unad.edu.co/handle/10596/68393| Title: | Modelo de predicción para identificar la gravedad de una enfermedad de respiración aguda (ERA) para las personas de Bogotá relacionados con el agente contaminante PM 25 y otros factores ambientales |
| metadata.dc.creator: | Méndez Espitia, Marco Antonio |
| metadata.dc.date.created: | 2025-05-10 |
| metadata.dc.subject.keywords: | Cobertura de predicción Contaminación atmosférica Ensamble de modelos Modelos predictivos Salud pública |
| metadata.dc.format.*: | |
| metadata.dc.type: | Proyecto aplicado |
| Abstract: | La contaminación es un problema mundial que afecta tanto a naciones industrializadas como en desarrollo, y Colombia no es la excepción. En Bogotá, la calidad del aire representa un reto importante, afectando de manera especial a la infancia y la tercera edad. Mediante la aplicación de técnicas de aprendizaje automático, se llevó a cabo la exploración de datos provenientes de cuatro fuentes distintas. Se consideró información de la Secretaría Distrital de Salud, así como datos públicos, incluyendo la Red de Monitoreo de Calidad del Aire (RMCAB), registros abiertos sobre la humedad en Bogotá y reportes de incendios proporcionados por el Cuerpo de Bomberos de la ciudad. Tras la unificación de las bases de datos y siguiendo la metodología CRISP-DM, se llevó a cabo el modelado de datos para desarrollar dos modelos de clasificación binaria capaces de evaluar la gravedad de la enfermedad. Este proceso se fundamenta en la exploración y preprocesamiento de los datos, precedido por un procedimiento de Extracción, Transformación y Carga (ETL, por sus siglas en inglés). Posteriormente, los modelos serán evaluados segmentando la información en conjuntos de entrenamiento, validación y prueba, lo que permitirá ajustar hiperparámetros clave del algoritmo LightGBM, tales como learning rate, num leaves y max depth. La selección de los valores óptimo se llevará a cabo considerando métricas de rendimiento, como la sensibilidad o la precisión, según los requerimientos del modelo. El objetivo final es generar una predicción a ocho días en el futuro, basada en el período promedio de incubación de una Enfermedad Respiratoria Aguda. Con la selección de los hiperparámetros óptimos para los modelos, se logró´ desarrollar un primer modelo que predice la gravedad de la enfermedad, clasificándola entre leve y grave, con un rendimiento del 86 % en la métrica de sensibilidad. Este resultado es notable, ya que se buscó maximizar la detección de casos graves. Por otro lado, el segundo modelo, que distingue entre enfermedades leves y medias, alcanzó una precisión del 80 %, lo que refleja un buen rendimiento al aprovechar el equilibrio de clases. Al ensamblar estos modelos en un único algoritmo, será posible clasificar nuevos registros en alguna de las tres categorías. |
| URI: | https://repository.unad.edu.co/handle/10596/68393 |
| metadata.dc.subject.category: | Ciencia de datos Salud Contaminación |
| metadata.dc.coverage.spatial: | cead_-_josé_acevedo_y_gómez |
| Appears in Collections: | Especialización en Ciencia de Datos y Analítica |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| mamendeze.pdf | 748.96 kB | Adobe PDF | ![]() View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
