Please use this identifier to cite or link to this item: https://repository.unad.edu.co/handle/10596/82471
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorRomero Parra, Camilo Enrique
dc.coverage.spatialcead_-_josé_celestino_mutis
dc.creatorHernández Guana, Federico
dc.date.accessioned2026-06-23T19:34:22Z
dc.date.available2026-06-23T19:34:22Z
dc.date.created2026-06-09
dc.identifier.urihttps://repository.unad.edu.co/handle/10596/82471
dc.description.abstractEl sector manufacturero es fundamental para la economía colombiana, por lo que comprender las dinámicas que impulsan su productividad es muy importante. Este proyecto aplicado implementa modelos de aprendizaje automático sobre los datos de la Encuesta Anual Manufacturera (EAM) del DANE, con el objetivo de desarrollar un modelo con alta capacidad de generalización para la estimación del valor agregado. El procesamiento de los datos abarcó un tratamiento de heterogeneidad mediante la eliminación de valores atípicos y el escalamiento de algunas variables, consolidando un conjunto de datos final con una división balanceada para ejecutar el entrenamiento y prueba. Se entrenaron y contrastaron modelos que fueron evaluados mediante métricas de desempeño. El algoritmo Random Forest fue seleccionado como el modelo ganador al alcanzar un resultado superior demostrando una alta robustez frente a la dispersión estructural de los datos. A través del análisis de importancia de características se determinó que la producción bruta y el consumo intermedio constituyen los predictores críticos de la variable objetivo. En conclusión, el modelo desarrollado provee una herramienta analítica con aplicación práctica para el análisis de consistencia de datos y el diseño de políticas orientadas a la optimización sectorial.
dc.formatpdf
dc.titleEvaluación de modelos de aprendizaje automático para la estimación del valor agregado en el sector manufacturero colombiano a partir de la EAM
dc.typeProyecto aplicado
dc.subject.keywordsValor agregado
dc.subject.keywordsMétricas de evaluación
dc.subject.keywordsEncuesta Anual Manufacturera
dc.subject.keywordsRandom Forest
dc.subject.keywordsAprendizaje automático
dc.description.abstractenglishThe manufacturing sector is fundamental to the Colombian economy, making it highly important to understand the dynamics that drive its productivity. This applied project implements machine learning models on data from DANE's Annual Manufacturing Survey (Encuesta Anual Manufacturera – EAM), aiming to develop a model with high generalization capacity for estimating value added. Data processing encompassed heterogeneity treatment through outlier removal and variable scaling, consolidating a final dataset with a balanced split to execute training and testing. Models were trained and contrasted, and then evaluated using performance metrics. The Random Forest algorithm was selected as the winning model upon achieving superior results, demonstrating high robustness against the structural dispersion of the data. Through feature importance analysis, it was determined that gross production and intermediate consumption constitute the critical predictors of the target variable. In conclusion, the developed model provides an analytical tool with practical application for data consistency analysis and the design of policies oriented toward sectoral optimization.
dc.subject.categoryAnálisis de datos
Appears in Collections:Especialización en Ciencia de Datos y Analítica

Files in This Item:
File Description SizeFormat 
fhernandezgu.pdf764.58 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.