Show simple item record

dc.contributor.advisorSánchez Sandoval, Eduardo
dc.coverage.spatialcead_-_josé_celestino_mutis
dc.creatorMonroy Lozano, Erika Milena
dc.date.accessioned2025-10-08T16:49:14Z
dc.date.available2025-10-08T16:49:14Z
dc.date.created2025-09-29
dc.identifier.urihttps://repository.unad.edu.co/handle/10596/74520
dc.description
dc.description.abstractEl presente proyecto desarrolla TalentAI, un sistema de recomendación inteligente basado en Machine Learning para la orientación vocacional de estudiantes de grado 10° y 11° de instituciones educativas de Bogotá D.C. en la elección de programas de educación superior. La investigación responde a la problemática de la deserción educativa en el primer año de estudios superiores en Colombia, la cual, según el Laboratorio de Economía de la Educación (LEE, 2023), alcanzó un 45,4% en programas universitarios y un 48,2% en programas tecnológicos. A esto se suma que, en Bogotá, la tasa de jóvenes que ni estudian ni trabajan (NINIs) oscila entre el 19% y el 22%, y que más del 60% de los estudiantes de grado 11 no reciben una orientación vocacional estructurada. Estas cifras evidencian la magnitud del problema y justifican la necesidad de un sistema que optimice la toma de decisiones académicas. La metodología implementada combina un enfoque mixto, con análisis cuantitativo mediante la evaluación comparativa de cinco algoritmos de Machine Learning: K-Nearest Neighbors (KNN), Redes Neuronales, Random Forest, XGBoost y Regresión Logística. Se entrenaron los modelos con 20.000 registros sintéticos de estudiantes, caracterizados por 13 variables predictoras (5 puntajes ICFES y 8 dimensiones de competencias), para predecir 30 áreas de conocimiento. Los datos de programas educativos fueron obtenidos del Sistema Nacional de Información de la Educación Superior (SNIES) y del SENA, identificando 46.900 programas a nivel nacional y filtrando 5.138 correspondientes a Bogotá D.C., mediante scripts automatizados de extracción y limpieza de datos. Como resultado, los modelos KNN y Redes Neuronales fueron seleccionados para su implementación en la plataforma, al evidenciar el mejor equilibrio entre precisión y eficiencia computacional frente a las demás alternativas evaluadas. En las pruebas realizadas, el modelo KNN obtuvo un accuracy de 0.660 y un F1-Score Macro de 0.626 con un tiempo de ejecución de 9.1 segundos, destacándose por su rapidez y consistencia; mientras que la Red Neuronal alcanzó un accuracy de 0.666 y un F1-Score Macro de 0.583 en 40.9 segundos, consolidándose como el de mayor capacidad predictiva. El sistema desarrollado incluye un formulario de evaluación de 100 competencias agrupadas en 8 dimensiones, una interfaz web intuitiva para la interacción con estudiantes y un motor de recomendación que sugiere programas educativos personalizados en función del perfil multidimensional del estudiante. Palabras clave: Machine Learning, orientación, neuronales, educación, vocacional.
dc.formatpdf
dc.titleExplorando oportunidades: un enfoque de machine learning para la recomendación personalizada de carreras y programas educativos en Colombia
dc.typeProyecto aplicado
dc.subject.keywordsEducación
dc.subject.keywordsModelos Neuronales
dc.subject.keywordsInteligencia Artificial
dc.subject.keywordsAprendizaje Automático
dc.subject.keywordsModelos predictivos
dc.subject.keywordsDeserción Educativa
dc.subject.keywordsMachine Learning
dc.subject.keywordsOrientación Vocacional
dc.description.abstractenglishThis project presents TalentAI, an intelligent recommendation system based on Machine Learning for vocational guidance of 10th and 11th grade students in Bogotá D.C., aimed at supporting the decision-making process when choosing higher education programs. The research addresses the problem of student dropout during the first year of higher education in Colombia, which, according to the Laboratorio de Economía de la Educación (LEE, 2023), reached 45.4% in university programs and 48.2% in technological programs. In Bogotá, this challenge is compounded by the fact that between 19% and 22% of young people are classified as NEETs (Not in Education, Employment, or Training), and more than 60% of high school seniors do not receive structured vocational guidance. The methodology combines a mixed approach, with quantitative analysis through the comparative evaluation of five Machine Learning algorithms: K-Nearest Neighbors (KNN), Neural Networks, Random Forest, XGBoost, and Logistic Regression. The models were trained with 20,000 synthetic student records characterized by thirteen predictive variables (5 ICFES test scores and eight competency dimensions) to predict thirty knowledge areas. Academic program data were obtained from the National Higher Education Information System (SNIES) and SENA, identifying 46.900 programs nationwide and filtering 2,281 corresponding to Bogotá D.C., through automated data extraction and cleaning scripts. The experimental results demonstrated that KNN achieved an accuracy of 0.666 and a weighted F1-macro of 0.626 with an execution time of 9.1 seconds, while Neural Networks reached the highest accuracy of 0.666 and a weighted F1-macro of 0.583 in 40.5 seconds, thus evidencing the best balance between predictive performance and computational efficiency. Consequently, these two models were selected for implementation in the final platform, which integrates an assessment form of 100 competencies organized in 8 dimensions, an intuitive web interface for student interaction, and a recommendation engine that suggests personalized academic programs according to each student’s multidimensional profile. This work contributes to bridging the gap in vocational orientation tools in Latin America, offering a scalable, data-driven solution for educational decision-making. Keywords: Machine Learning, orientation, neural, education, vocational.
dc.subject.categoryPolíticas Públicas y Educación en América Latina
dc.subject.categoryCiencias de la Educación y Orientación Vocacional
dc.subject.categoryCiencias Sociales aplicadas a la Educación
dc.subject.categoryEstadística y Ciencia de Datos
dc.subject.categoryInvestigación
dc.subject.categoryCiencias de la Computación e Inteligencia Artificial


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record