Evaluación de modelos de aprendizaje automático para la estimación del valor agregado en el sector manufacturero colombiano a partir de la EAM

Hernández Guana, Federico

Please use this identifier to cite or link to this item: https://repository.unad.edu.co/handle/10596/82471

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Romero Parra, Camilo Enrique
dc.coverage.spatial	cead_-_josé_celestino_mutis
dc.creator	Hernández Guana, Federico
dc.date.accessioned	2026-06-23T19:34:22Z
dc.date.available	2026-06-23T19:34:22Z
dc.date.created	2026-06-09
dc.identifier.uri	https://repository.unad.edu.co/handle/10596/82471
dc.description.abstract	El sector manufacturero es fundamental para la economía colombiana, por lo que comprender las dinámicas que impulsan su productividad es muy importante. Este proyecto aplicado implementa modelos de aprendizaje automático sobre los datos de la Encuesta Anual Manufacturera (EAM) del DANE, con el objetivo de desarrollar un modelo con alta capacidad de generalización para la estimación del valor agregado. El procesamiento de los datos abarcó un tratamiento de heterogeneidad mediante la eliminación de valores atípicos y el escalamiento de algunas variables, consolidando un conjunto de datos final con una división balanceada para ejecutar el entrenamiento y prueba. Se entrenaron y contrastaron modelos que fueron evaluados mediante métricas de desempeño. El algoritmo Random Forest fue seleccionado como el modelo ganador al alcanzar un resultado superior demostrando una alta robustez frente a la dispersión estructural de los datos. A través del análisis de importancia de características se determinó que la producción bruta y el consumo intermedio constituyen los predictores críticos de la variable objetivo. En conclusión, el modelo desarrollado provee una herramienta analítica con aplicación práctica para el análisis de consistencia de datos y el diseño de políticas orientadas a la optimización sectorial.
dc.format	pdf
dc.title	Evaluación de modelos de aprendizaje automático para la estimación del valor agregado en el sector manufacturero colombiano a partir de la EAM
dc.type	Proyecto aplicado
dc.subject.keywords	Valor agregado
dc.subject.keywords	Métricas de evaluación
dc.subject.keywords	Encuesta Anual Manufacturera
dc.subject.keywords	Random Forest
dc.subject.keywords	Aprendizaje automático
dc.description.abstractenglish	The manufacturing sector is fundamental to the Colombian economy, making it highly important to understand the dynamics that drive its productivity. This applied project implements machine learning models on data from DANE's Annual Manufacturing Survey (Encuesta Anual Manufacturera – EAM), aiming to develop a model with high generalization capacity for estimating value added. Data processing encompassed heterogeneity treatment through outlier removal and variable scaling, consolidating a final dataset with a balanced split to execute training and testing. Models were trained and contrasted, and then evaluated using performance metrics. The Random Forest algorithm was selected as the winning model upon achieving superior results, demonstrating high robustness against the structural dispersion of the data. Through feature importance analysis, it was determined that gross production and intermediate consumption constitute the critical predictors of the target variable. In conclusion, the developed model provides an analytical tool with practical application for data consistency analysis and the design of policies oriented toward sectoral optimization.
dc.subject.category	Análisis de datos
Appears in Collections:	Especialización en Ciencia de Datos y Analítica

Files in This Item:

File	Description	Size	Format
fhernandezgu.pdf		764.58 kB	Adobe PDF	View/Open

Show simple item record