english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/51015 Cómo citar
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorMarotta, Adriana-
dc.contributor.advisorSerra, Flavia-
dc.contributor.authorDe León, José Pedro-
dc.date.accessioned2025-08-11T20:39:03Z-
dc.date.available2025-08-11T20:39:03Z-
dc.date.issued2025-
dc.identifier.citationDe León, J. Calidad de datos basada en contexto en Data Lakes [en línea] Tesis de grado. Montevideo : Udelar. FI. INCO, 2025.es
dc.identifier.urihttps://hdl.handle.net/20.500.12008/51015-
dc.description.abstractEn la actualidad, el uso de tecnologías de Big Data se ha vuelto cada vez más presente en diversos sectores, llevando a que las empresas deban basar sus estrategias en decisiones tomadas a partir de grandes volúmenes de datos. A medida que crece la dependencia en estos sistemas, también se vuelve fundamental contar con herramientas y estrategias que permitan evaluar la calidad de los datos utilizados, ya que una mala calidad puede generar análisis erróneos y afectar el valor obtenido de los datos. Sin embargo, el estudio sistemático de la calidad de los datos en entornos de Big Data sigue siendo limitado y representa un área de investigación en desarrollo. Este proyecto se basa en dos trabajos previos: el proyecto de grado de (Cortés, 2024), que propone una arquitectura genérica de Big Data con capacidades de gestión de la calidad de los datos, y la tesis de doctorado de (Serra, 2024), que propone el modelado del contexto de los datos y la definición de modelos de calidad de datos que consideran el modelo de contexto. En este trabajo se unifican ambas propuestas, brindando la capacidad de incorporar modelos de contexto al proceso de gestión de calidad de los datos, en la arquitectura genérica de Big Data. Para ello, se realiza un análisis sobre la incidencia de los componentes de contexto sobre los datos en las distintas zonas del Data Lake, a través del cual se identifica un nuevo componente de contexto, denominado “Data Lineage”. En base a este análisis, se proponen modificaciones al modelo de metadatos de la arquitectura, especificando las nuevas entidades y relaciones necesarias para poder representar modelos de contexto y modelos de calidad de datos basados en ellos. Para demostrar la viabilidad de nuestra propuesta, se diseñó e implementó una prueba de concepto, utilizando el DBMS de bases de datos de grafos Neo4j, para la implementación de los metadatos de calidad de datos y de contexto.es
dc.format.extent99 p.es
dc.format.mimetypeapplication/pdfes
dc.language.isoeses
dc.publisherUdelar. FI.es
dc.rightsLas obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)es
dc.subjectBig Dataes
dc.subjectData Lakees
dc.subjectCalidad de Datoses
dc.subjectContexto de los Datoses
dc.titleCalidad de datos basada en contexto en Data Lakes.es
dc.typeTesis de gradoes
dc.contributor.filiacionDe León José Pedro, Universidad de la República (Uruguay). Facultad de Ingeniería.-
thesis.degree.grantorUniversidad de la República (Uruguay). Facultad de Ingenieríaes
thesis.degree.nameIngeniero en Computaciónes
dc.rights.licenceLicencia Creative Commons Atribución (CC - By 4.0)es
Aparece en las colecciones: Tesis de grado - Instituto de Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
Del25.pdfTesis de grado8,09 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons