Show simple item record

dc.contributor.advisorPipicano Guzmán, Felipe Alexander
dc.coverage.spatialcead_-_josé_celestino_mutis
dc.creatorCabarcas Gómez, Jesús Antonio
dc.creatorGómez Aranzalez, José Nicolás
dc.date.accessioned2026-02-12T21:15:57Z
dc.date.available2026-02-12T21:15:57Z
dc.date.created2025-12-16
dc.identifier.urihttps://repository.unad.edu.co/handle/10596/78694
dc.description.abstractLa presente investigación aborda el desafío de optimizar el proceso de control fiscal en la Contraloría General de la República mediante la implementación de técnicas de Ciencia de Datos e Inteligencia Artificial sobre la base de datos del Sistema Automatizado para el Proceso Auditor (APA). El objetivo principal fue desarrollar un modelo predictivo capaz de estimar la probabilidad de materialización de hallazgos con incidencia fiscal, disciplinaria y penal, facilitando así la priorización de auditorías y la recuperación del patrimonio público. La metodología integró un enfoque híbrido de procesamiento de datos. Se utilizó Inteligencia Artificial Generativa (Meta Llama 3 - 70B) para enriquecer el conjunto de datos, transformando campos de texto no estructurado (causas y efectos redactados por auditores) en variables categóricas estandarizadas. Posteriormente, se entrenó un modelo de aprendizaje supervisado de clasificación multi-etiqueta basado en el algoritmo Random Forest Classifier, aplicando técnicas de balanceo de clases para mitigar la asimetría en la distribución de los datos. Los resultados obtenidos fueron concluyentes: el modelo alcanzó un Jaccard Score de 0.9360 y una precisión perfecta (F1-Score de 1.00) en la detección de hallazgos con incidencia fiscal, superando significativamente a la línea base de Regresión Logística. Estos hallazgos demuestran que la herramienta propuesta permite filtrar y priorizar automáticamente el 20% de los casos de mayor relevancia, optimizando la asignación de recursos humanos y reduciendo la carga operativa en la revisión de hallazgos administrativos.
dc.formatpdf
dc.titleAplicación de un modelo predictivo para la optimización de auditorías y recuperación del patrimonio público basado en datos del sistema APA
dc.typeProyecto aplicado
dc.subject.keywordsControl Fiscal
dc.subject.keywordsMachine Learning
dc.subject.keywordsRandom Forest
dc.subject.keywordsInteligencia Artificial Generativa
dc.subject.keywordsLlama 3
dc.subject.keywordsPriorización de Auditorías
dc.subject.keywordsSistema APA
dc.description.abstractenglishThis research addresses the challenge of optimizing the fiscal control process at the Comptroller General of the Republic by implementing Data Science and Artificial Intelligence techniques on the Automated Auditor Process System (APA) database. The main objective was to develop a predictive model capable of estimating the probability of fiscal, disciplinary, and penal findings, thus facilitating audit prioritization and public asset recovery. The methodology integrated a hybrid data processing approach. Generative Artificial Intelligence (Meta Llama 3 - 70B) was used to enrich the dataset, transforming unstructured text fields (causes and effects written by auditors) into standardized categorical variables. Subsequently, a multi-label supervised learning model based on the Random Forest Classifier algorithm was trained, applying class balancing techniques to mitigate asymmetry in data distribution. The results were conclusive: the model achieved a Jaccard Score of 0.9360 and perfect precision (F1-Score of 1.00) in detecting findings with fiscal incidence, significantly outperforming the Logistic Regression baseline. These findings demonstrate that the proposed tool allows for the automatic filtering and prioritization of the top 20% of cases with the highest relevance, optimizing human resource allocation and reducing operational load in the review of administrative findings.
dc.subject.categoryIngeniería y Tecnología


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record