Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12008/53592
Cómo citar
| Título: | Computación de alto desempeño aplicada al procesamiento de grandes volúmenes de datos genómicos |
| Autor: | Núñez, Agustín Fourcade, Ignacio Abbona, Paula |
| Tutor: | Pedemonte, Martín Dufrechou, Ernesto |
| Tipo: | Tesis de grado |
| Palabras clave: | Bioinformatics, High-Performance Computing, GPU Acceleration, Tensor Cores, Distance Matrix, All-Pairs Shortest Paths, Parallel Algorithms |
| Fecha de publicación: | 2025 |
| Resumen: | El cómputo de distancias entre vectores es un problema relevante en el ámbito de la bioinformática, utilizado principalmente en diversas etapas en el análisis de datos genómicos. A pesar de que existen implementaciones de alto desempeño, muchas de ellas no explotan características particulares del problema biológico, y, por ello, no aprovechan plenamente los recursos de cómputo al trabajar con conjuntos de datos a gran escala. En este trabajo, diseñamos, implementamos y evaluamos diferentes algoritmos que aprovechan propiedades específicas de los datos genómicos en plataformas CPU y GPU, obteniendo mejoras significativas tanto en el uso de memoria como en la eficiencia computacional respecto a los métodos de referencia del estado del arte. En particular, proponemos un esquema de codificación de los datos que reduce sustancialmente el uso de memoria y permite explotar de manera efectiva la jerarquía de memoria de los recursos de cómputo. A partir de este esquema derivamos un método eficiente para la comparación de secuencias de ADN, capaz de reproducir el resultado equivalente al de la distancia euclidiana, utilizando únicamente una cantidad mínima de operaciones bit a bit. Asimismo, se realizaron optimizaciones sobre el algoritmo R-Kleene que explotan la simetría del problema. Por otra parte, los algoritmos desarrollados pueden adaptarse fácilmente a arquitecturas híbridas y al procesamiento por lotes, gracias a la descomposición natural del problema. Finalmente, realizamos una evaluación experimental para analizar el desempeño computacional de las propuestas, obteniendo mejoras significativas sobre los algoritmos utilizados como línea base. |
| Editorial: | Udelar.FI. |
| Citación: | Núñez, A., Fourcade, I. y Abbona, P. Computación de alto desempeño aplicada al procesamiento de grandes volúmenes de datos genómicos [en línea] Tesis de grado. Montevideo: Udelar. FI. INCO, 2025. |
| Título Obtenido: | Ingeniero en Computación. |
| Facultad o Servicio que otorga el Título: | Universidad de la República (Uruguay). Facultad de Ingeniería |
| Licencia: | Licencia Creative Commons Atribución - No Comercial (CC - By-NC 4.0) |
| Aparece en las colecciones: | Tesis de grado - Instituto de Computación |
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | ||
|---|---|---|---|---|---|
| NFA25.pdf | Tesis de grado | 1,72 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons