Please use this identifier to cite or link to this item: https://repository.unad.edu.co/handle/10596/62821
Title: ProspectAI - Modelos de Machine Learning y Preprocesamiento de Lenguaje Natural para la Clasificación Efectiva de Clientes
metadata.dc.creator: García Vidal, José Fernando
metadata.dc.date.created: 2024-07-04
metadata.dc.subject.keywords: Machine learning
Técnicas de NLP (Procesamiento de Lenguaje Natural)
Aprendizaje automático
Modelos supervisados
Calibración de hiperparámetros
metadata.dc.format.*: pdf
metadata.dc.type: Proyecto aplicado
Abstract: Este proyecto investiga cómo optimizar la clasificación de clientes potenciales para MAVV mediante técnicas avanzadas de procesamiento de datos y aprendizaje automático. La investigación comienza con un análisis exploratorio de los datos, seguido de la implementación de técnicas de procesamiento de lenguaje natural (NLP) para extraer características relevantes de los mensajes de los clientes. Se evaluaron varios modelos de aprendizaje supervisado, incluyendo Regresión Logística, Árboles de Decisión, Bosques Aleatorios, k-Nearest Neighbors y Máquinas de Soporte Vectorial, utilizando métricas como precisión, recall y el puntaje F1. En particular, la Regresión Logística, después de un ajuste meticuloso, alcanzó una precisión de prueba de 0.962, destacando por su eficacia junto con el modelo K-Nearest Neighbors, que logró una precisión impresionante de 0.991. El ajuste de hiperparámetros fue fundamental para afinar la precisión y el rendimiento de los modelos. Este proceso, apoyado por la validación cruzada, mejoró significativamente su capacidad para generalizar sobre nuevos datos. La Regresión Logística mostró no solo alta precisión sino también una excelente regularización, evidenciada por una destacada curva ROC con un área bajo la curva (AUC) de 0.91. El estudio destaca la importancia de combinar análisis de datos, NLP y aprendizaje automático para mejorar la clasificación de leads en marketing digital, proporcionando un marco sólido para futuras investigaciones y aplicaciones prácticas en entornos empresariales.
URI: https://repository.unad.edu.co/handle/10596/62821
metadata.dc.subject.category: Ciencias de Datos
Machine Learning
Procesamiento de Lenguaje Natural
metadata.dc.coverage.spatial: udr_-_Cali
Appears in Collections:Especialización en Ciencia de Datos y Analítica

Files in This Item:
File Description SizeFormat 
jfgarciav.pdf1.62 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.