Aplicación de un modelo predictivo para la optimización de auditorías y recuperación del patrimonio público basado en datos del sistema APA

Cabarcas Gómez, Jesús Antonio; Gómez Aranzalez, José Nicolás

Please use this identifier to cite or link to this item: https://repository.unad.edu.co/handle/10596/78694

Title:	Aplicación de un modelo predictivo para la optimización de auditorías y recuperación del patrimonio público basado en datos del sistema APA
metadata.dc.creator:	Cabarcas Gómez, Jesús Antonio Gómez Aranzalez, José Nicolás
metadata.dc.date.created:	2025-12-16
metadata.dc.subject.keywords:	Control Fiscal Machine Learning Random Forest Inteligencia Artificial Generativa Llama 3 Priorización de Auditorías Sistema APA
metadata.dc.format.*:	pdf
metadata.dc.type:	Proyecto aplicado
Abstract:	La presente investigación aborda el desafío de optimizar el proceso de control fiscal en la Contraloría General de la República mediante la implementación de técnicas de Ciencia de Datos e Inteligencia Artificial sobre la base de datos del Sistema Automatizado para el Proceso Auditor (APA). El objetivo principal fue desarrollar un modelo predictivo capaz de estimar la probabilidad de materialización de hallazgos con incidencia fiscal, disciplinaria y penal, facilitando así la priorización de auditorías y la recuperación del patrimonio público. La metodología integró un enfoque híbrido de procesamiento de datos. Se utilizó Inteligencia Artificial Generativa (Meta Llama 3 - 70B) para enriquecer el conjunto de datos, transformando campos de texto no estructurado (causas y efectos redactados por auditores) en variables categóricas estandarizadas. Posteriormente, se entrenó un modelo de aprendizaje supervisado de clasificación multi-etiqueta basado en el algoritmo Random Forest Classifier, aplicando técnicas de balanceo de clases para mitigar la asimetría en la distribución de los datos. Los resultados obtenidos fueron concluyentes: el modelo alcanzó un Jaccard Score de 0.9360 y una precisión perfecta (F1-Score de 1.00) en la detección de hallazgos con incidencia fiscal, superando significativamente a la línea base de Regresión Logística. Estos hallazgos demuestran que la herramienta propuesta permite filtrar y priorizar automáticamente el 20% de los casos de mayor relevancia, optimizando la asignación de recursos humanos y reduciendo la carga operativa en la revisión de hallazgos administrativos.
URI:	https://repository.unad.edu.co/handle/10596/78694
metadata.dc.subject.category:	Ingeniería y Tecnología
metadata.dc.coverage.spatial:	cead_-_josé_celestino_mutis
Appears in Collections:	Especialización en Ciencia de Datos y Analítica

Files in This Item:

File	Description	Size	Format
jcabarcasg.pdf		1.31 MB	Adobe PDF	View/Open

Show full item record