Implementación de un algoritmo de anonimización para la plataforma de datos masivos de Plan Ceibal

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/24212 Cómo citar

Título:	Implementación de un algoritmo de anonimización para la plataforma de datos masivos de Plan Ceibal
Autor:	Serra Oddo, Bruno Rosolino Ruétalo, Diego Rivas Masullo, María Soledad
Tutor:	Etcheverry, Lorena Giménez, Eduardo
Tipo:	Tesis de grado
Palabras clave:	Privacidad, Datos Personales, Entornos distribuidos, Spark, Big Data
Fecha de publicación:	2020
Resumen:	En la actualidad, cada vez más información es compartida entre distintas organizaciones con distintos fines, como por ejemplo, para extraer estadísticas que permitan tomar ciertas decisiones, dar soporte a investigaciones científicas o para ser utilizados en modelos de Aprendizaje Automático. Cuando esta información refiere a datos personales, es donde se torna fundamental que la privacidad de estos se preserve. Dado que gestiona los datos de los niños, niñas y docentes uruguayos, el Plan Ceibal posee un especial interés en el escenario descripto. Es con el objetivo de brindar una herramienta que permita a la organización anonimizar los datos personales que posee, que el presente proyecto estudia algunos aspectos de la anonimización de datos en el contexto de Big Data, abordando el problema de escalabilidad que tienen hoy en día las técnicas de anonimización para entornos centralizados. Para ello, se exponen distintas técnicas, mencionando en cada una los enfoques que estas utilizan. Además, se brinda una descripción detallada del marco tecnológico del entorno distribuido utilizado y se proporciona la implementación de un algoritmo de anonimización basado en la técnica k-anonymity junto con una comparación de resultados en un ambiente distribuido y uno centralizado, utilizando PySpark como interfaz de comunicación con Spark. Se concluye exponiendo los desafíos que enfrenta el responsable del proceso de anonimización de datos, así como también las dificultades que enfrenta al momento de aplicar una de estas técnicas con el fin de mantener la mayor utilidad de los datos posible al mismo tiempo que se preserva su privacidad.
Editorial:	Udelar.FI
Citación:	Serra Oddo, B., Rosolino Ruétalo, D. y Rivas Masullo, M. Implementación de un algoritmo de anonimización para la plataforma de datos masivos de Plan Ceibal [en línea] Tesis de grado. Montevideo : Udelar. FI. INCO, 2020.
Título Obtenido:	Ingeniero en Computación
Facultad o Servicio que otorga el Título:	Universidad de la República (Uruguay). Facultad de Ingeniería
Licencia:	Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
Cobertura geográfica:	Uruguay
Aparece en las colecciones:	Tesis de grado - Instituto de Computación

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
SRR20.pdf	Tesis de grado	2,54 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons