english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/53592 Cómo citar
Título: Computación de alto desempeño aplicada al procesamiento de grandes volúmenes de datos genómicos
Autor: Núñez, Agustín
Fourcade, Ignacio
Abbona, Paula
Tutor: Pedemonte, Martín
Dufrechou, Ernesto
Tipo: Tesis de grado
Palabras clave: Bioinformatics, High-Performance Computing, GPU Acceleration, Tensor Cores, Distance Matrix, All-Pairs Shortest Paths, Parallel Algorithms
Fecha de publicación: 2025
Resumen: El cómputo de distancias entre vectores es un problema relevante en el ámbito de la bioinformática, utilizado principalmente en diversas etapas en el análisis de datos genómicos. A pesar de que existen implementaciones de alto desempeño, muchas de ellas no explotan características particulares del problema biológico, y, por ello, no aprovechan plenamente los recursos de cómputo al trabajar con conjuntos de datos a gran escala. En este trabajo, diseñamos, implementamos y evaluamos diferentes algoritmos que aprovechan propiedades específicas de los datos genómicos en plataformas CPU y GPU, obteniendo mejoras significativas tanto en el uso de memoria como en la eficiencia computacional respecto a los métodos de referencia del estado del arte. En particular, proponemos un esquema de codificación de los datos que reduce sustancialmente el uso de memoria y permite explotar de manera efectiva la jerarquía de memoria de los recursos de cómputo. A partir de este esquema derivamos un método eficiente para la comparación de secuencias de ADN, capaz de reproducir el resultado equivalente al de la distancia euclidiana, utilizando únicamente una cantidad mínima de operaciones bit a bit. Asimismo, se realizaron optimizaciones sobre el algoritmo R-Kleene que explotan la simetría del problema. Por otra parte, los algoritmos desarrollados pueden adaptarse fácilmente a arquitecturas híbridas y al procesamiento por lotes, gracias a la descomposición natural del problema. Finalmente, realizamos una evaluación experimental para analizar el desempeño computacional de las propuestas, obteniendo mejoras significativas sobre los algoritmos utilizados como línea base.
Editorial: Udelar.FI.
Citación: Núñez, A., Fourcade, I. y Abbona, P. Computación de alto desempeño aplicada al procesamiento de grandes volúmenes de datos genómicos [en línea] Tesis de grado. Montevideo: Udelar. FI. INCO, 2025.
Título Obtenido: Ingeniero en Computación.
Facultad o Servicio que otorga el Título: Universidad de la República (Uruguay). Facultad de Ingeniería
Licencia: Licencia Creative Commons Atribución - No Comercial (CC - By-NC 4.0)
Aparece en las colecciones: Tesis de grado - Instituto de Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
NFA25.pdfTesis de grado 1,72 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons