| dc.contributor.advisor | Varona Taborda, María Alejandra | |
| dc.coverage.spatial | ccav_-_neiva | |
| dc.creator | Rodgers Calderón, Andrés Felipe | |
| dc.date.accessioned | 2025-10-02T16:48:13Z | |
| dc.date.available | 2025-10-02T16:48:13Z | |
| dc.date.created | 2025-07-25 | |
| dc.identifier.uri | https://repository.unad.edu.co/handle/10596/74267 | |
| dc.description | | |
| dc.description.abstract | El presente proyecto tiene por objetivo diseñar una herramienta analítica automatizada que diagnostique la calidad de los catálogos de inventario, integrando un proceso ETL para la extracción, transformación y carga de datos, validaciones estructurales basadas en el estándar UNSPSC y técnicas de procesamiento de lenguaje natural para detectar inconsistencias semánticas. A partir de una base de datos maestra consolidada, aplicando algoritmos de clustering y detección de duplicados para identificar patrones de error y clasificar registros según su nivel de calidad.Se fundamenta en teorías de calidad de datos y gobernanza informacional, incorporando buenas prácticas de normalización y trazabilidad. Metodológicamente, se adoptó un enfoque cuantitativo y experimental con un diseño iterativo en cuatro fases: construcción de la base de conocimiento, desarrollo del módulo de diagnóstico semántico, validación con catálogos reales y mejora continua del sistema. Se prevé que el prototipo reduzca en al menos un 80 % el tiempo de validación manual, mejore la codificación y garantice la auditabilidad de los procesos. Como resultado, se generan reportes técnicos automatizados, visualizaciones y un mecanismo histórico de ejecuciones que facilitan el hallazgo por usuarios no técnicos. Además, contempla la migración del prototipo a un servicio web, para facilitar su despliegue y colaboración remota en entornos corporativos. Este enfoque fortalece la disponibilidad continua y la mantenibilidad del sistema, cumpliendo con las recomendaciones de gobernanza de datos internacionales. Finalmente, la propuesta ofrece una solución escalable, accesible y replicable que optimiza los procesos de catalogación, aporta eficiencia operativa y eleva la calidad de la información en la cadena de abastecimiento. | |
| dc.format | pdf | |
| dc.title | Desarrollo de una herramienta analítica para el diagnóstico de catálogos de inventario | |
| dc.type | Proyecto aplicado | |
| dc.subject.keywords | Abastecimiento | |
| dc.subject.keywords | ETL | |
| dc.subject.keywords | Inventario | |
| dc.subject.keywords | Semántica | |
| dc.subject.keywords | Trazabilidad | |
| dc.description.abstractenglish | The objective of this project is to design an automated analytical tool that diagnoses the quality of inventory catalogs, integrating an ETL process for data extraction, transformation, and loading, structural validations based on the UNSPSC standard, and natural language processing techniques to detect semantic inconsistencies. Based on a consolidated master database, clustering and duplicate detection algorithms are applied to identify error patterns and classify records according to their quality level. It is based on data quality and information governance theories, incorporating good practices in standardization and traceability. Methodologically, a quantitative and experimental approach was adopted with an iterative design in four phases: construction of the knowledge base, development of the semantic diagnosis module, validation with real catalogs, and continuous improvement of the system. The prototype is expected to reduce manual validation time by at least 80%, improve coding, and ensure the auditability of processes. As a result, automated technical reports, visualizations, and a historical execution mechanism are generated, facilitating discovery by non-technical users. In addition, it contemplates the migration of the prototype to a web service to facilitate its deployment and remote collaboration in corporate environments. This approach strengthens the continuous availability and maintainability of the system, complying with international data governance recommendations. Finally, the proposal offers a scalable, accessible, and replicable solution that optimizes cataloging processes, provides operational efficiency, and raises the quality of information in the supply chain. | |
| dc.subject.category | Ciencia de datos | |
| dc.subject.category | Analítica de datos | |
| dc.subject.category | Ingeniería de software | |
| dc.subject.category | Gestión de inventarios | |
| dc.subject.category | Cadena de abastecimiento | |