Please use this identifier to cite or link to this item:
https://repository.unad.edu.co/handle/10596/78694| Title: | Aplicación de un modelo predictivo para la optimización de auditorías y recuperación del patrimonio público basado en datos del sistema APA |
| metadata.dc.creator: | Cabarcas Gómez, Jesús Antonio Gómez Aranzalez, José Nicolás |
| metadata.dc.date.created: | 2025-12-16 |
| metadata.dc.subject.keywords: | Control Fiscal Machine Learning Random Forest Inteligencia Artificial Generativa Llama 3 Priorización de Auditorías Sistema APA |
| metadata.dc.format.*: | |
| metadata.dc.type: | Proyecto aplicado |
| Abstract: | La presente investigación aborda el desafío de optimizar el proceso de control fiscal en la Contraloría General de la República mediante la implementación de técnicas de Ciencia de Datos e Inteligencia Artificial sobre la base de datos del Sistema Automatizado para el Proceso Auditor (APA). El objetivo principal fue desarrollar un modelo predictivo capaz de estimar la probabilidad de materialización de hallazgos con incidencia fiscal, disciplinaria y penal, facilitando así la priorización de auditorías y la recuperación del patrimonio público. La metodología integró un enfoque híbrido de procesamiento de datos. Se utilizó Inteligencia Artificial Generativa (Meta Llama 3 - 70B) para enriquecer el conjunto de datos, transformando campos de texto no estructurado (causas y efectos redactados por auditores) en variables categóricas estandarizadas. Posteriormente, se entrenó un modelo de aprendizaje supervisado de clasificación multi-etiqueta basado en el algoritmo Random Forest Classifier, aplicando técnicas de balanceo de clases para mitigar la asimetría en la distribución de los datos. Los resultados obtenidos fueron concluyentes: el modelo alcanzó un Jaccard Score de 0.9360 y una precisión perfecta (F1-Score de 1.00) en la detección de hallazgos con incidencia fiscal, superando significativamente a la línea base de Regresión Logística. Estos hallazgos demuestran que la herramienta propuesta permite filtrar y priorizar automáticamente el 20% de los casos de mayor relevancia, optimizando la asignación de recursos humanos y reduciendo la carga operativa en la revisión de hallazgos administrativos. |
| URI: | https://repository.unad.edu.co/handle/10596/78694 |
| metadata.dc.subject.category: | Ingeniería y Tecnología |
| metadata.dc.coverage.spatial: | cead_-_josé_celestino_mutis |
| Appears in Collections: | Especialización en Ciencia de Datos y Analítica |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| jcabarcasg.pdf | 1.31 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.