Diseño de un modelo de clasificación para la preselección automatizada de candidatas en el programa social “Mujer, Equidad y Género” en el municipio de Cota

Mejía Romero, David Sebastián

dc.contributor.advisor	Pipicano Guzmán, Felipe Alexander
dc.coverage.spatial	cead_-_Zipaquirá
dc.creator	Mejía Romero, David Sebastián
dc.date.accessioned	2025-09-17T19:55:01Z
dc.date.available	2025-09-17T19:55:01Z
dc.date.created	2025-06-01
dc.identifier.uri	https://repository.unad.edu.co/handle/10596/73940
dc.description
dc.description.abstract	En toda organización, surge la necesidad de optimizar procesos, en este caso el proceso a optimizar es el de selección, con el fin de reducir tiempos y ayudar en la toma de decisiones, la importancia del desarrollo del sector público en el uso de las nuevas tecnologías, por lo cual se un modelo de inteligencia artificial con la misión de automatizar y optimizar los procesos de selección de candidatas de acuerdo con características preestablecidas que permita dar prioridad a quien lo requiera, por lo cual, la primera fase del modelo se centra en un análisis de los datos en este caso del programa ‘Mujer, Equidad y Género’ del municipio de Cota, en sus convocatorias anteriores para determinar las características con mayor importancia para el posterior entrenamiento del modelo, como en todo análisis de datos se requiere de un proceso de limpieza eliminando o tratando datos faltantes o datos erróneos que induzcan al error del modelo, también dar un buen manejo o comprensión de los outliers lo cual son valores atípicos dentro de la dimensionalidad de la variable que pueden ser atribuidos a un error humano al ingresar los datos a la base de datos. Posterior a la limpieza de la base de datos se divide en dos y se procede al entrenamiento del modelo, en este caso el modelo seleccionado es el de Árbol de decisión, debido a que es un modelo de clasificación probabilística, el cual puede generar una lista con la probabilidad de que el individuo sea aceptado o no, esto basado en las impurezas de las “hojas” de dicho modelo, también permite detectar las características más relevantes a la hora de tomar la decisión. Después se realiza la prueba de eficiencia del modelo con la otra parte de la base de datos para ver qué tan acertado es el modelo o si se necesitan ajustes para lograr una eficiencia o probabilidad de acierto cercana al 1. Luego de que el modelo esté ajustado y listo para operar, solicitará más datos como entrada y retornará una lista ordenada con la probabilidad de que cada individuo sea aceptado, es decir las primeras en la lista son las que el modelo detectó con mayor relación a las candidatas seleccionadas en convocatorias anteriores, con la diferencia de que este proceso es posible realizarlo en cuestión de segundos.
dc.format	pdf
dc.title	Diseño de un modelo de clasificación para la preselección automatizada de candidatas en el programa social “Mujer, Equidad y Género” en el municipio de Cota
dc.type	Proyecto aplicado
dc.subject.keywords	Optimización
dc.subject.keywords	Clasificación
dc.subject.keywords	Herramienta
dc.subject.keywords	Decisiones
dc.subject.keywords	IA
dc.description.abstractenglish	In every organization, the need arises to optimize processes; in this case, the process to be optimized is selection, aiming to reduce time and assist in decision-making. This highlights the importance of public sector development in utilizing new technologies. Therefore, an artificial intelligence model is implemented with the mission of automating and optimizing the selection process for candidates based on pre-established characteristics, enabling priority to be given to those who require it. The first phase of the model focuses on data analysis, specifically from the “Women, Equity, and Gender” program in Cota, utilizing data from previous calls to determine the most significant characteristics for training the model. As with any data analysis, a cleaning process is required to eliminate or treat missing or erroneous data that could lead to model errors. Additionally, proper handling and understanding of outliers are necessary; these are atypical values within the variable's dimensionality that may result from human errors when entering data into the database. After cleaning the database, it is divided into two parts, and the model training begins. In this case, the selected model is a Decision Tree, as it is a probabilistic classification model capable of generating a list with the probability of whether an individual will be accepted or not, based on the impurities in the model's “leaves.” It also helps identify the most relevant characteristics when making a decision. Following this, the model's efficiency is tested with the other part of the database to assess its accuracy and whether adjustments are needed to achieve an efficiency or accuracy probability close to 1. Once the model is fine-tuned and ready for operation, it will request additional input data and return an ordered list showing the probability of each individual being accepted. Essentially, the top candidates on the list are those identified by the model as having the strongest correlation with previously selected candidates from earlier calls. The difference here is that this process can be completed in just seconds.
dc.subject.category	Investigación