| dc.contributor.advisor | Vélez Jaramillo, Sebastián | |
| dc.coverage.spatial | cead_-_josé_acevedo_y_gómez | |
| dc.creator | Estupiñan Diaz, Paula Andrea | |
| dc.creator | Alfonso Cortes, Deiver Enrique | |
| dc.date.accessioned | 2025-09-08T20:22:33Z | |
| dc.date.available | 2025-09-08T20:22:33Z | |
| dc.date.created | 2025-09-02 | |
| dc.identifier.uri | https://repository.unad.edu.co/handle/10596/73633 | |
| dc.description.abstract | Las plataformas de redes sociales han transformado la manera en que las personas expresan sus opiniones y sentimientos sobre acontecimientos actuales. Reddit, en particular, se ha
consolidado como un espacio activo de discusión, donde los usuarios comparten perspectivas
sobre temas de relevancia global, incluido el conflicto entre Israel y Palestina. Las conversaciones generadas en torno a este tema reflejan una amplia variedad de sentimientos que fluctúan según el
contexto. Sin embargo, la magnitud, velocidad y complejidad del contenido dificultan su análisis manual, lo que hace necesario recurrir a técnicas automatizadas y escalables.
Este estudio aplica técnicas de Procesamiento de Lenguaje Natural (PLN) y aprendizaje automático para analizar más de 2.4 millones de comentarios en inglés publicados en Reddit sobre dicho conflicto. El proceso metodológico incluyó un análisis exploratorio inicial (EDA) y un
preprocesamiento exhaustivo de los textos, mediante una clase personalizada que permitió limpiar
y normalizar los datos para su posterior análisis. A partir de este, se implementaron y compararon
tres modelos preentrenados de clasificación de sentimientos: DistilBERT, T5 y RoBERTa.
Los resultados permitieron identificar sentimientos predominantes como enojo, tristeza,
alegría, miedo y neutralidad, así como analizar su evolución temporal y detectar picos
significativos asociados a eventos clave del conflicto. La comparación entre modelos evidenció
diferencias en la forma de interpretar el discurso digital, aportando perspectivas complementarias
sobre la conversación colectiva en línea. | |
| dc.format | pdf | |
| dc.title | Análisis de sentimiento del conflicto Israel-Palestina en Reddit mediante técnicas de procesamiento de lenguaje natural | |
| dc.type | Proyecto aplicado | |
| dc.subject.keywords | Reddit | |
| dc.subject.keywords | Conflicto Israel-Palestina | |
| dc.subject.keywords | Análisis de sentimientos | |
| dc.subject.keywords | Procesamiento de lenguaje natural | |
| dc.subject.keywords | Modelos preentrenados | |
| dc.description.abstractenglish | Social media platforms have transformed the way people express their opinions and
emotions regarding current events. Reddit, in particular, has become an active space for discussion,
where users share perspectives on globally relevant issues, including the conflict between Israel
and Palestine. The conversations surrounding this topic reflect a wide range of emotions that
fluctuate depending on the context. However, the scale, speed, and complexity of the content make
manual analysis challenging, requiring the use of automated and scalable techniques.
This study applies Natural Language Processing (NLP) and machine learning techniques
to analyze over 2.4 million English-language comments posted on Reddit about the conflict. The
methodological process included an initial exploratory data analysis (EDA) and comprehensive
text preprocessing using a custom class designed to clean and normalize the data for subsequent
analysis. Based on this, three pre-trained sentiment classification models—DistilBERT, T5, and
RoBERTa—were implemented and compared.
The results allowed for the identification of predominant emotions such as anger, sadness,
joy, fear, and neutrality, as well as the analysis of their temporal evolution and the detection of
significant peaks associated with key conflict events. The comparison between models revealed
differences in the interpretation of digital discourse, offering complementary perspectives on the
collective online conversation. | |
| dc.subject.category | Ingeniería | |