Optimización en el proceso de consolidación y reporte de indicadores institucionales mediante análisis de datos y Machine Learning
Share
Date
2026-05-06Author
Bonza Sánchez, Sandra Milena
Advisor
Mejía Manzano, Julio EduardoCitación
Bibliographic managers
Keywords
Regional / Country coverage
cead_-_josé_acevedo_y_gómezMetadata
Show full item record
PDF Document
Description of the content
La consolidación manual de indicadores hospitalarios genera reprocesos, inconsistencias y limitaciones para el análisis oportuno de la información institucional. Este trabajo presenta el diseño e implementación de un sistema automatizado orientado a optimizar el procesamiento y reporte de indicadores de hospitalización en la Clínica de Marly Jorge Cavelier Gaviria, integrando técnicas de analítica de datos y aprendizaje automático bajo la metodología CRISP-DM.
El sistema fue desarrollado sobre la información correspondiente al período 2021–2024, procesando 22.723 registros de ingresos hospitalarios y una base de indicadores institucionales consolidada que comprende 48 períodos mensuales. Como fuente principal para el modelado se utilizó la base oficial de indicadores de hospitalización, que incluye variables de ocupación, flujo de pacientes y días de estancia, consolidada por el área de estadística de la institución a partir del sistema SERVINTE. Se implementó un pipeline en Python que automatiza la extracción, limpieza, estandarización y consolidación de la información, generando archivos estructurados compatibles con herramientas de Business Intelligence y eliminando la dependencia de procedimientos manuales propensos a error.
En la fase de modelado se aplicaron tres enfoques complementarios sobre la tabla mensual consolidada, que registra un promedio de 417 ingresos y 421 egresos mensuales, una estancia promedio de 4,15 días y una ocupación promedio del 82,1% para el período analizado. El algoritmo K-Means segmentó los períodos mensuales en tres perfiles operativos diferenciados —alto volumen, volumen medio y bajo volumen con alta complejidad—, con un índice Silhouette de 0,4804, identificando como hallazgo relevante que los primeros ocho meses de 2021 presentaron ...























