| dc.contributor.advisor | Pipicano Guzmán, Felipe Alexander | |
| dc.coverage.spatial | cead_-_Zipaquirá | |
| dc.creator | Mejía Romero, David Sebastián | |
| dc.date.accessioned | 2025-09-17T19:55:01Z | |
| dc.date.available | 2025-09-17T19:55:01Z | |
| dc.date.created | 2025-06-01 | |
| dc.identifier.uri | https://repository.unad.edu.co/handle/10596/73940 | |
| dc.description | | |
| dc.description.abstract | En toda organización, surge la necesidad de optimizar procesos, en este caso el proceso a optimizar es el de selección, con el fin de reducir tiempos y ayudar en la toma de decisiones, la
importancia del desarrollo del sector público en el uso de las nuevas tecnologías, por lo cual se
un modelo de inteligencia artificial con la misión de automatizar y optimizar los procesos de selección de candidatas de acuerdo con características preestablecidas que permita dar prioridad a quien lo requiera, por lo cual, la primera fase del modelo se centra en un análisis de los datos en este caso del programa ‘Mujer, Equidad y Género’ del municipio de Cota, en sus convocatorias anteriores para determinar las características con mayor importancia para el
posterior entrenamiento del modelo, como en todo análisis de datos se requiere de un proceso de
limpieza eliminando o tratando datos faltantes o datos erróneos que induzcan al error del modelo,
también dar un buen manejo o comprensión de los outliers lo cual son valores atípicos dentro de
la dimensionalidad de la variable que pueden ser atribuidos a un error humano al ingresar los
datos a la base de datos.
Posterior a la limpieza de la base de datos se divide en dos y se procede al entrenamiento
del modelo, en este caso el modelo seleccionado es el de Árbol de decisión, debido a que es un
modelo de clasificación probabilística, el cual puede generar una lista con la probabilidad de que
el individuo sea aceptado o no, esto basado en las impurezas de las “hojas” de dicho modelo,
también permite detectar las características más relevantes a la hora de tomar la decisión.
Después se realiza la prueba de eficiencia del modelo con la otra parte de la base de datos para
ver qué tan acertado es el modelo o si se necesitan ajustes para lograr una eficiencia o
probabilidad de acierto cercana al 1. Luego de que el modelo esté ajustado y listo para operar,
solicitará más datos como entrada y retornará una lista ordenada con la probabilidad de que cada
individuo sea aceptado, es decir las primeras en la lista son las que el modelo detectó con mayor
relación a las candidatas seleccionadas en convocatorias anteriores, con la diferencia de que este
proceso es posible realizarlo en cuestión de segundos. | |
| dc.format | pdf | |
| dc.title | Diseño de un modelo de clasificación para la preselección automatizada de candidatas en el programa social “Mujer, Equidad y Género” en el municipio de Cota | |
| dc.type | Proyecto aplicado | |
| dc.subject.keywords | Optimización | |
| dc.subject.keywords | Clasificación | |
| dc.subject.keywords | Herramienta | |
| dc.subject.keywords | Decisiones | |
| dc.subject.keywords | IA | |
| dc.description.abstractenglish | In every organization, the need arises to optimize processes; in this case, the process to be
optimized is selection, aiming to reduce time and assist in decision-making. This highlights the
importance of public sector development in utilizing new technologies. Therefore, an artificial
intelligence model is implemented with the mission of automating and optimizing the selection
process for candidates based on pre-established characteristics, enabling priority to be given to
those who require it. The first phase of the model focuses on data analysis, specifically from the
“Women, Equity, and Gender” program in Cota, utilizing data from previous calls to determine
the most significant characteristics for training the model. As with any data analysis, a cleaning
process is required to eliminate or treat missing or erroneous data that could lead to model errors.
Additionally, proper handling and understanding of outliers are necessary; these are atypical
values within the variable's dimensionality that may result from human errors when entering data
into the database.
After cleaning the database, it is divided into two parts, and the model training begins. In
this case, the selected model is a Decision Tree, as it is a probabilistic classification model
capable of generating a list with the probability of whether an individual will be accepted or not,
based on the impurities in the model's “leaves.” It also helps identify the most relevant
characteristics when making a decision. Following this, the model's efficiency is tested with the
other part of the database to assess its accuracy and whether adjustments are needed to achieve
an efficiency or accuracy probability close to 1. Once the model is fine-tuned and ready for
operation, it will request additional input data and return an ordered list showing the probability
of each individual being accepted. Essentially, the top candidates on the list are those identified
by the model as having the strongest correlation with previously selected candidates from earlier
calls. The difference here is that this process can be completed in just seconds. | |
| dc.subject.category | Investigación | |