Diseño e implementación de un proceso ETL en Python para la consolidación y análisis de datos empresariales, orientado al apoyo a la toma de decisiones mediante Power BI

Gamba Alvarado, Jeison Andrés

dc.contributor.advisor	Rivadeneira Muñoz, Lina Roció
dc.coverage.spatial	cead_-_josé_celestino_mutis
dc.creator	Gamba Alvarado, Jeison Andrés
dc.date.accessioned	2026-06-26T21:07:17Z
dc.date.available	2026-06-26T21:07:17Z
dc.date.created	2026-02-09
dc.identifier.uri	https://repository.unad.edu.co/handle/10596/82643
dc.description
dc.description.abstract	El proyecto aplicado tiene como objetivo diseñar e implementar un proceso ETL en Python (Pandas) para integrar datos empresariales provenientes de múltiples archivos CSV, con el fin de identificar duplicidades, inconsistencias y errores de digitación, y presentar los resultados mediante un dashboard en Power BI orientado a la gerencia. La iniciativa se desarrolla en la empresa Gestiones y Representaciones Chía S.A.S., que gestiona información de 43 empresas clientes y actualmente enfrenta fragmentación de datos, redundancias y dificultades para el análisis global. El proyecto definirá estándares técnicos de calidad de datos, documentará el flujo ETL a través de técnicas de profiling data y consolidará la información para evaluar su estado. Finalmente, el resultado se enfoca en visualizar y dimensionar el esfuerzo de corrección requerido, establecer pautas de mejora y fortalecer la confiabilidad de la información, contribuyendo a una mayor eficiencia operativa y calidad en la gestión de datos a través de visualizaciones que permitan apoyar la toma de decisiones estratégicas.
dc.format	pdf
dc.title	Diseño e implementación de un proceso ETL en Python para la consolidación y análisis de datos empresariales, orientado al apoyo a la toma de decisiones mediante Power BI
dc.type	Proyecto aplicado
dc.subject.keywords	ETL
dc.subject.keywords	Data Profiling
dc.subject.keywords	Calidad de datos
dc.subject.keywords	Integración de datos
dc.subject.keywords	Inteligencia de negocios
dc.description.abstractenglish	This applied project aims to design and implement an ETL (Extract, Transform, Load) process in Python using the Pandas library to integrate enterprise data from multiple CSV files, with the purpose of identifying duplicates, inconsistencies, and data entry errors. The project is developed at Gestiones y Representaciones Chía S.A.S., a company that manages information from 43 client organizations and currently faces data fragmentation, redundancy, and limited capability for consolidated analysis.The proposed solution defines technical data quality standards and applies data profiling techniques to analyze and document the current state of the datasets throughout the ETL process. The consolidated dataset enables a structured evaluation of data quality issues and supports the estimation of the effort required for data correction and standardization. Finally, the results are presented through a Power BI dashboard oriented toward managerial decision-making, allowing stakeholders to visualize data quality indicators, identify critical areas for improvement, and strengthen the reliability of information. This approach contributes to improved operational efficiency and enhanced data-driven decision-making within the organization.
dc.subject.category	Business Intelligence