| dc.contributor.advisor | Rivadeneira Muñoz, Lina Roció | |
| dc.coverage.spatial | cead_-_josé_celestino_mutis | |
| dc.creator | Gamba Alvarado, Jeison Andrés | |
| dc.date.accessioned | 2026-06-26T21:07:17Z | |
| dc.date.available | 2026-06-26T21:07:17Z | |
| dc.date.created | 2026-02-09 | |
| dc.identifier.uri | https://repository.unad.edu.co/handle/10596/82643 | |
| dc.description | | |
| dc.description.abstract | El proyecto aplicado tiene como objetivo diseñar e implementar un proceso ETL en Python (Pandas) para integrar datos empresariales provenientes de múltiples archivos CSV, con el fin de identificar duplicidades, inconsistencias y errores de digitación, y presentar los resultados mediante un dashboard en Power BI orientado a la gerencia. La iniciativa se desarrolla en la empresa Gestiones y Representaciones Chía S.A.S., que gestiona información de 43 empresas clientes y actualmente enfrenta fragmentación de datos, redundancias y dificultades para el análisis global. El proyecto definirá estándares técnicos de calidad de datos, documentará el flujo ETL a través de técnicas de profiling data y consolidará la información para evaluar su estado. Finalmente, el resultado se enfoca en visualizar y dimensionar el esfuerzo de corrección requerido, establecer pautas de mejora y fortalecer la confiabilidad de la información, contribuyendo a una mayor eficiencia operativa y calidad en la gestión de datos a través de visualizaciones que permitan apoyar la toma de decisiones estratégicas. | |
| dc.format | pdf | |
| dc.title | Diseño e implementación de un proceso ETL en Python para la consolidación y análisis de datos empresariales, orientado al apoyo a la toma de decisiones mediante Power BI | |
| dc.type | Proyecto aplicado | |
| dc.subject.keywords | ETL | |
| dc.subject.keywords | Data Profiling | |
| dc.subject.keywords | Calidad de datos | |
| dc.subject.keywords | Integración de datos | |
| dc.subject.keywords | Inteligencia de negocios | |
| dc.description.abstractenglish | This applied project aims to design and implement an ETL (Extract, Transform, Load) process in Python using the Pandas library to integrate enterprise data from multiple CSV files, with the purpose of identifying duplicates, inconsistencies, and data entry errors. The project is developed at Gestiones y Representaciones Chía S.A.S., a company that manages information from 43 client organizations and currently faces data fragmentation, redundancy, and limited capability for consolidated analysis.The proposed solution defines technical data quality standards and applies data profiling techniques to analyze and document the current state of the datasets throughout the ETL process. The consolidated dataset enables a structured evaluation of data quality issues and supports the estimation of the effort required for data correction and standardization. Finally, the results are presented through a Power BI dashboard oriented toward managerial decision-making, allowing stakeholders to visualize data quality indicators, identify critical areas for improvement, and strengthen the reliability of information. This approach contributes to improved operational efficiency and enhanced data-driven decision-making within the organization. | |
| dc.subject.category | Business Intelligence | |