Please use this identifier to cite or link to this item: https://repository.unad.edu.co/handle/10596/78694
Title: Aplicación de un modelo predictivo para la optimización de auditorías y recuperación del patrimonio público basado en datos del sistema APA
metadata.dc.creator: Cabarcas Gómez, Jesús Antonio
Gómez Aranzalez, José Nicolás
metadata.dc.date.created: 2025-12-16
metadata.dc.subject.keywords: Control Fiscal
Machine Learning
Random Forest
Inteligencia Artificial Generativa
Llama 3
Priorización de Auditorías
Sistema APA
metadata.dc.format.*: pdf
metadata.dc.type: Proyecto aplicado
Abstract: La presente investigación aborda el desafío de optimizar el proceso de control fiscal en la Contraloría General de la República mediante la implementación de técnicas de Ciencia de Datos e Inteligencia Artificial sobre la base de datos del Sistema Automatizado para el Proceso Auditor (APA). El objetivo principal fue desarrollar un modelo predictivo capaz de estimar la probabilidad de materialización de hallazgos con incidencia fiscal, disciplinaria y penal, facilitando así la priorización de auditorías y la recuperación del patrimonio público. La metodología integró un enfoque híbrido de procesamiento de datos. Se utilizó Inteligencia Artificial Generativa (Meta Llama 3 - 70B) para enriquecer el conjunto de datos, transformando campos de texto no estructurado (causas y efectos redactados por auditores) en variables categóricas estandarizadas. Posteriormente, se entrenó un modelo de aprendizaje supervisado de clasificación multi-etiqueta basado en el algoritmo Random Forest Classifier, aplicando técnicas de balanceo de clases para mitigar la asimetría en la distribución de los datos. Los resultados obtenidos fueron concluyentes: el modelo alcanzó un Jaccard Score de 0.9360 y una precisión perfecta (F1-Score de 1.00) en la detección de hallazgos con incidencia fiscal, superando significativamente a la línea base de Regresión Logística. Estos hallazgos demuestran que la herramienta propuesta permite filtrar y priorizar automáticamente el 20% de los casos de mayor relevancia, optimizando la asignación de recursos humanos y reduciendo la carga operativa en la revisión de hallazgos administrativos.
URI: https://repository.unad.edu.co/handle/10596/78694
metadata.dc.subject.category: Ingeniería y Tecnología
metadata.dc.coverage.spatial: cead_-_josé_celestino_mutis
Appears in Collections:Especialización en Ciencia de Datos y Analítica

Files in This Item:
File Description SizeFormat 
jcabarcasg.pdf1.31 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.