Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12008/45647
Cómo citar
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.author | Cortés Lasalle, Carolina | - |
dc.date.accessioned | 2024-09-03T12:51:29Z | - |
dc.date.available | 2024-09-03T12:51:29Z | - |
dc.date.issued | 2024 | - |
dc.identifier.citation | Cortés Lasalle, C. Gestión de calidad de datos en arquitecturas de Big Data [en línea] Tesis de grado. Montevideo: Udelar. FI. INCO, 2024. | es |
dc.identifier.uri | https://hdl.handle.net/20.500.12008/45647 | - |
dc.description.abstract | El término “Big Data” (BD) hace referencia a grandes colecciones de datos heterogéneos, que se generan a altas velocidades (Marotta y Serra, s.f.). Hoy en día, estas colecciones de datos son utilizadas por herramientas de Analítica Avanzada (AA) y Business Intelligence (BI) (B. Inmon, Levins, y Srivastava, 2021). A lo largo de los años han surgido distintos sistemas para soportar los diversos requisitos de análisis de los datos en BD, como Data Warehouses (DW) y Data Lakes (DL). Sin embargo, ninguno de estos sistemas logra brindar soporte para herramientas de AA y BI, a la vez (B. Inmon y cols., 2021; Marotta y Serra, s.f.). Es por esto que en la actualidad, la comunidad académica busca hacer una transición a una nueva arquitectura de análisis de BD, denominada “Data Lakehouse”, la cual logra integrar las capacidades de DW y DL en un mismo sistema unificado. Sin embargo, actualmente no existe una arquitectura establecida para este sistema, como sí existen para los DW y DL (Armbrust, Ghodsi, Xin, y Zaharia, 2021; B. Inmon y cols., 2021). Por otro lado, debido al volumen de datos de BD y los distintos requerimientos de análisis impuestos por diferentes usuarios, la gestión de la calidad de datos cobra un papel sumamente relevante en estas arquitecturas y su gestión debe adaptarse a toda la variabilidad que estas presentan. En la actualidad no existen técnicas o metodologías globalmente aceptadas, que sean específicas para la gestión de calidad de datos en arquitecturas de este tipo (Ravat y Zhao, 2019a; Armbrust y cols., 2021; Zouari, Kabachi, Boukadi, y Ghedira Guegan, 2021; Nargesian, Zhu, Miller, Pu, y Arocena, 2019). En respuesta a estas problemáticas, este trabajo propone una arquitectura genérica de BD que logre combinar las capacidades de DW y DL, incorporando la gestión de calidad de datos dentro de la misma. A su vez, para verificar la factibilidad técnica y tecnológica de la propuesta, se desarrolló un prototipo reducido de la arquitectura propuesta. | es |
dc.format.extent | 200 p. | es |
dc.format.mimetype | application/pdf | es |
dc.language.iso | es | es |
dc.publisher | Udelar. FI. | es |
dc.rights | Las obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014) | es |
dc.subject | Data warehouse | es |
dc.subject | Big Data | es |
dc.subject | Data Lake | es |
dc.subject | Data Lakehouse | es |
dc.subject | Calidad de datos | es |
dc.title | Gestión de calidad de datos en arquitecturas de Big Data. | es |
dc.type | Tesis de grado | es |
dc.contributor.filiacion | Cortés Lasalle Carolina, Universidad de la República (Uruguay). Facultad de Ingeniería. | - |
thesis.degree.grantor | Universidad de la República (Uruguay). Facultad de Ingeniería. | es |
thesis.degree.name | Ingeniero en Computación. | es |
dc.rights.licence | Licencia Creative Commons Atribución (CC - By 4.0) | es |
Aparece en las colecciones: | Tesis de grado - Instituto de Computación |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | ||
---|---|---|---|---|---|
Cor24.pdf | Tesis de grado | 11,35 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons