Show simple item record

dc.contributor.advisorRivadeneira Muñoz, Lina Roció
dc.coverage.spatialcead_-_josé_celestino_mutis
dc.creatorGamba Alvarado, Jeison Andrés
dc.date.accessioned2026-06-26T21:07:17Z
dc.date.available2026-06-26T21:07:17Z
dc.date.created2026-02-09
dc.identifier.urihttps://repository.unad.edu.co/handle/10596/82643
dc.description
dc.description.abstractEl proyecto aplicado tiene como objetivo diseñar e implementar un proceso ETL en Python (Pandas) para integrar datos empresariales provenientes de múltiples archivos CSV, con el fin de identificar duplicidades, inconsistencias y errores de digitación, y presentar los resultados mediante un dashboard en Power BI orientado a la gerencia. La iniciativa se desarrolla en la empresa Gestiones y Representaciones Chía S.A.S., que gestiona información de 43 empresas clientes y actualmente enfrenta fragmentación de datos, redundancias y dificultades para el análisis global. El proyecto definirá estándares técnicos de calidad de datos, documentará el flujo ETL a través de técnicas de profiling data y consolidará la información para evaluar su estado. Finalmente, el resultado se enfoca en visualizar y dimensionar el esfuerzo de corrección requerido, establecer pautas de mejora y fortalecer la confiabilidad de la información, contribuyendo a una mayor eficiencia operativa y calidad en la gestión de datos a través de visualizaciones que permitan apoyar la toma de decisiones estratégicas.
dc.formatpdf
dc.titleDiseño e implementación de un proceso ETL en Python para la consolidación y análisis de datos empresariales, orientado al apoyo a la toma de decisiones mediante Power BI
dc.typeProyecto aplicado
dc.subject.keywordsETL
dc.subject.keywordsData Profiling
dc.subject.keywordsCalidad de datos
dc.subject.keywordsIntegración de datos
dc.subject.keywordsInteligencia de negocios
dc.description.abstractenglishThis applied project aims to design and implement an ETL (Extract, Transform, Load) process in Python using the Pandas library to integrate enterprise data from multiple CSV files, with the purpose of identifying duplicates, inconsistencies, and data entry errors. The project is developed at Gestiones y Representaciones Chía S.A.S., a company that manages information from 43 client organizations and currently faces data fragmentation, redundancy, and limited capability for consolidated analysis.The proposed solution defines technical data quality standards and applies data profiling techniques to analyze and document the current state of the datasets throughout the ETL process. The consolidated dataset enables a structured evaluation of data quality issues and supports the estimation of the effort required for data correction and standardization. Finally, the results are presented through a Power BI dashboard oriented toward managerial decision-making, allowing stakeholders to visualize data quality indicators, identify critical areas for improvement, and strengthen the reliability of information. This approach contributes to improved operational efficiency and enhanced data-driven decision-making within the organization.
dc.subject.categoryBusiness Intelligence


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record