Análisis de resultados globales de las pruebas Saber 11 de 2015 a 2019

Arteaga Ceballos, Claudia Milena

Please use this identifier to cite or link to this item: https://repository.unad.edu.co/handle/10596/70320

Title:	Análisis de resultados globales de las pruebas Saber 11 de 2015 a 2019
metadata.dc.creator:	Arteaga Ceballos, Claudia Milena
metadata.dc.date.created:	2025-06-11
metadata.dc.subject.keywords:	Educación secundaria Pruebas Saber 11 ICFES Ciencia de Datos Aprendizaje Automático
metadata.dc.format.*:	pdf
metadata.dc.type:	Proyecto aplicado
Abstract:	Las bases de datos públicas compartidas en la plataforma “Datos Abiertos” dan la posibilidad de realizar ejercicios académicos con información real. En el ámbito académico, el acceso a este tipo de información fomenta el desarrollo de proyectos que buscan generar conocimiento a partir del análisis de datos reales, contribuyendo a la toma de decisiones basadas en evidencia. Al explorar las bases de datos académicas disponibles en la biblioteca de la universidad, encuentro que la revisión de los resultados de las pruebas Saber 11 se ha abordado desde muchas perspectivas, analizando aspectos como el desempeño académico, las condiciones socioeconómicas, la infraestructura educativa y otros elementos clave. El presente estudio se centra en el análisis de estos resultados con un enfoque basado en técnicas de ciencia de datos. El conjunto de datos utilizado en este proyecto contiene múltiples variables demográficas, académicas y socioeconómicas. Estas variables permiten formular diversas preguntas de investigación, explorando la relación entre factores como el nivel educativo de los padres, el estrato socioeconómico, el tipo de colegio (público o privado), la ubicación geográfica y los puntajes obtenidos en las pruebas. Para ello, se trabajará con el set de datos de resultados únicos para las pruebas Saber 11 de los años 2010 al 2022. Sin embargo, el análisis se acotará a los años 2015 a 2019, 5 años en total (se excluyen los años 2020 en adelante para evitar variaciones por los efectos que pudo tener la pandemia en el desempeño de los estudiantes). La base de datos tiene 51 variables y, para el período de estudio (resultados 2015 a 2019) hay alrededor de 2.2 millones de registros. El proyecto abarcó diversas técnicas de ciencia de datos, incluyendo exploración y análisis de datos, limpieza y estandarización, análisis de correlaciones, y generación y evaluación de modelos predictivos. Entre los modelos a utilizar, se consideran regresión lineal simple y algoritmos de clasificación, lo que permitirá identificar patrones y relaciones significativas entre las variables. Finalmente, se presentarán conclusiones y hallazgos relevantes sobre los factores que influyen en los puntajes de las pruebas Saber 11, contribuyendo al entendimiento del desempeño académico en Colombia.
URI:	https://repository.unad.edu.co/handle/10596/70320
metadata.dc.subject.category:	Ciencia de Datos Aprendizaje Automático Educación secundaria Pruebas Saber 11 ICFES
metadata.dc.coverage.spatial:	cead_-_josé_celestino_mutis
Appears in Collections:	Especialización en Ciencia de Datos y Analítica

Files in This Item:

File	Description	Size	Format
cmarteagac.pdf		3.19 MB	Adobe PDF	View/Open

Show full item record