Predicción de latencias en sistemas de microservicios utilizando redes neuronales de grafos heterogéneos (LQ-GNN)

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/55372 Cómo citar

Título:	Predicción de latencias en sistemas de microservicios utilizando redes neuronales de grafos heterogéneos (LQ-GNN)
Autor:	Lepratti Gilles, Franco
Tutor:	Richart, Matías Baliosian, Javier
Tipo:	Tesis de grado
Palabras clave:	Redes neuronales de grafos, Microservicios, Predicción de latencia, Grafos heterogéneos, LQ-GNN, PyTorch geometric
Fecha de publicación:	2026
Resumen:	Este Proyecto de Grado presenta la implementación y evaluación de un modelo de Red Neuronal de Grafos Heterogéneos para la predicción de latencias en sistemas basados en microservicios, Este mismo se encuentra en el marco del enfoque propuesto en LQ-GNN: A Graph Neural Network Model for Latency Prediction of Microservice-based Applications for Elasticity Control in the Computing Continuum (Richart y cols., 2025). El trabajo propuesto en el paper se enmarca en una línea de investigación orientada al escalado multidimensional de microservicios en el computing continuum —una infraestructura distribuida que integra recursos de cómputo desde el borde de la red hasta la nube—, donde disponer de predicciones de latencia rápidas y confiables resulta relevante para analizar alternativas de configuración, despliegue y asignación de recursos. Las arquitecturas de microservicios ofrecen ventajas importantes en términos de escalabilidad, mantenibilidad y despliegue independiente. Sin embargo, también introducen desafíos significativos en el apartado de la performance, ya que la latencia end-to-end depende de múltiples factores interrelacionados, entre ellos la topología de dependencias, la distribución de carga, la asignación de recursos y la interacción entre servicios. En este contexto, los enfoques basados en grafos resultan especialmente adecuados, ya que permiten modelar de forma explícita la estructura relacional del sistema. El modelo implementado representa cada aplicación como un grafo heterogéneo en el que los nodos corresponden a distintas entidades del sistema, en particular tareas, actividades y rutas de ejecución, mientras que las aristas capturan relaciones de dependencia y composición. A través de un esquema de message passing, el modelo aprende representaciones internas capaces de estimar la latencia asociada a una consulta bajo determinadas condiciones de carga y configuración. La implementación se desarrolló utilizando PyTorch y PyTorch Geometric, lo que permitió construir una versión funcional, reproducible y más flexible que la implementación del artículo original. El modelo fue entrenado y evaluado con cuatro datasets (GNN_4tier, GNN_mix, GNN_social-network y GNN_social-network-ut), lo que permitió analizar su comportamiento sobre topologías distintas y estudiar su capacidad de generalización. En la configuración base (la misma con la que se entreno la implementación del paper) para predicción de latencia promedio, el mejor resultado se obtuvo en GNN_4tier, con un Mean Absolute Percentage Error (MAPE) de 10,85% en test. Para los demás datasets, se obtuvieron los siguientes valores, 33,91% en GNN_mix, 21,81% en GNN_social-network y 24,46% en GNN_social-network-ut. Entonces se realizo un extensión de la evaluación para la predicción del percentil 95 de la latencia y realizar una etapa adicional de optimización, se observaron mejoras sustanciales, alcanzando valores de MAPE de 13,71% en GNN_mix, 7,65% en GNN_social-network y 8,62% en GNN_social-network-ut. Estos resultados muestran que la implementación desarrollada además de cumplir su propósito original (ser funcional), sino que también presenta un margen de mejora importante cuando se dedica esfuerzo adicional al ajuste experimental. En conjunto, el trabajo demuestra no solo que es posible implementar el modelo LQ-GNN fuera del framework original, sino también reproducir su lógica sobre un stack moderno, el cual va a permitir mas maleabilidad en los detalles del modelo como pueden ser agregaciones o demás cosas que se explicaran en el informe y obtener resultados razonables en distintos escenarios. Más allá de las métricas alcanzadas, la principal contribución radica en haber construido una base experimental y de software reutilizable, o sea que a posterior puede ser utilizado para ampliarlo o cambiar cosas del modelo como agregaciones o formas de envió de message passing, además de robustez y aplicabilidad en contextos más cercanos a producción.
Editorial:	Udelar.FI.
Citación:	Lepratti Gilles, F. Predicción de latencias en sistemas de microservicios utilizando redes neuronales de grafos heterogéneos (LQ-GNN) [en línea] Tesis de grado. Montevideo : Udelar. FI. INCO, 2026.
Título Obtenido:	Ingeniero en Computación.
Facultad o Servicio que otorga el Título:	Universidad de la República (Uruguay). Facultad de Ingeniería
Licencia:	Licencia Creative Commons Atribución - No Comercial (CC - By-NC 4.0)
Aparece en las colecciones:	Tesis de grado - Instituto de Computación

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
Lep26.pdf	Tesis de grado	1,01 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons