Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12008/41967
Cómo citar
Título: | Compresión de datos crudos de secuenciación de ADN por nanoporos. |
Autor: | Castelli Ottati, Rafael Agustín |
Título Obtenido: | Ingeniero en Computación. |
Facultad o Servicio que otorga el Título: | Universidad de la República (Uruguay). Facultad de Ingeniería. |
Tutor: | Dufort y Álvarez, Guillermo Martín, Álvaro |
Tipo: | Tesis de grado |
Palabras clave: | Compresión de datos sin pérdida, Secuenciación de ADN, Nanoporos, MinION, POD5, Códigos de Golomb, Codificación aritmética |
Fecha de publicación: | 2023 |
Resumen: | En este proyecto, generamos un framework para el desarrollo de compresores de datos crudos de secuenciación de ADN por nanoporos que permite prototipar de forma sencilla nuevos compresores y modelos estadísticos para dichas señales. Trabajamos sobre el formato de archivo POD5 y su biblioteca homónima, desarrollados por Oxford Nanopore Technologies (ONT) para suplantar a su predecesor, FAST5. El producto desarrollado permite la implementación de nuevos compresores que se integran a la biblioteca de POD5, así como compresores independientes. Presentamos dos compresores para este tipo de datos: PGNanoS y PGNano5. Estos compresores logran una mejora porcentual relativa de aproximadamente 2.9% respecto a Vbz, que es el compresor por defecto para POD5, al costo de considerable incremento de costo computacional. Estos compresores sirven como una línea base para investigaciones futuras, usando el framework desarrollado. También presentamos un conjunto de pruebas y análisis sobre los datos de secuenciación y posibles codificaciones que nos permiten interpretar el funcionamiento de Vbz, así como proponer alternativas para mejorar los resultados obtenidos por PGNano5 y PGNanoS. |
Editorial: | Udelar. FI. |
Citación: | Castelli Ottati, R. Compresión de datos crudos de secuenciación de ADN por nanoporos [en línea] Tesis de grado. Montevideo : Udelar. FI. INCO, 2023. |
Licencia: | Licencia Creative Commons Atribución (CC - By 4.0) |
Aparece en las colecciones: | Tesis de grado - Instituto de Computación |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | ||
---|---|---|---|---|---|
Cas23.pdf | Tesis de grado | 1,73 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons