Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12008/54407
Cómo citar
| Título: | Herramientas para la vigilancia epidemiológica del virus de Influenza tipo A mediante aprendizaje automático |
| Autor: | Pérez Valiente, Ramiro Andrés |
| Tutor: | Pazos Obregón, Flavio Fajardo Rossi, Álvaro |
| Tipo: | Tesis de maestría |
| Descriptores: | ENFERMEDADES PRODUCIDAS POR VIRUS, EPIDEMIOLOGIA, VIRUS, APRENDIZAJE AUTOMATICO, VIRUS INFLUENZA |
| Fecha de publicación: | 2025 |
| Resumen: | Este trabajo aborda la implementación de modelos de aprendizaje automático para la clasificación de virus Influenza A (VIA) a partir de secuencias de su proteína hemaglutinina (HA), con tres objetivos centrales: identificar el hospedero de origen, predecir el subtipo de HA y detectar automáticamente la patogenicidad viral (HPAI o LPAI). Esta información es clave para la vigilancia genómica y la toma de decisiones sanitarias rápidas ante brotes del virus.
En una primera etapa, se desarrollaron y evaluaron modelos supervisados y no supervisados para la clasificación del hospedero (aves, humanos, cerdos), utilizando distintos descriptores de secuencia. Se aplicaron técnicas de reducción de dimensionalidad (PCA, t-SNE) y clustering (KMeans, GMM), que permitieron observar agrupamientos coherentes con los subtipos, especialmente usando los descriptores DPC y Moran. Para desarrollar el clasificador del hospedero se entrenaron modelos supervisados (KNM, SVM, Random Forest, XGBoost), siendo KNN-DPC el modelo más robusto y generalizable, especialmente en la clasificación de secuencias parciales. El análisis de importancia de características reveló regiones funcionales de HA asociadas diferencialmente a cada hospedero, como HR2, epítopo Ca2 y dominio transmembrana en aves; epítopo Sb en humanos; y sitios de clivaje y reconocimiento de ácido siálico en cerdos.
En la segunda etapa, se abordó la clasificación del subtipo de HA (entre 16 subtipos) y la detección de motivos de alta o baja patogenicidad. Para ello, se desarrollaron modelos supervisados utilizando nuevamente el descriptor DPC. El algoritmo SVM mostró el mejor desempeño general, manteniendo altos valores de F1-macro y AUC-PR incluso sobre secuencias parciales no contenidas en el entrenamiento. Adicionalmente, se diseñó un script en Python que permite identificar automáticamente la presencia de motivos multibásicos en el sitio del clivaje HA1/HA2, asociados a alta patogenicidad en subtipos H5 y H7. Este script fue validado con secuencias de la epizootia ocurrida en Uruguay (2023), clasificando correctamente todas las variantes como HPAI del clado 2.3.4.
Finalmente, los modelos entrenados y el script de patogenicidad se integraron en una plataforma interactiva desarrollada con Stremlit, capaz de procesar secuencias de HA y predecir en tiempo real el hospedero, subtipo y nivel de patogenicidad, constituyendo una herramienta ágil par la vigilancia molecular.
En conjunto, estos capítulos demuestran que el uso de descriptores proteicos adecuado, como DPC, combinado con modelos robustos de aprendizaje automático, como SVM y KNN, permite extraer información biológicamente relevante a partir de secuencias virales, con aplicaciones directas en la vigilancia genómica del virus de la Influenza A. Además, los análisis funcionales aportan evidencia sobre regiones moleculares vinculadas al tropismo y la adaptación interespecie, reforzando el valor de estos enfoques en virología y salud pública. |
| Editorial: | Udelar. FC. |
| Citación: | Pérez Valiente, R. Herramientas para la vigilancia epidemiológica del virus de Influenza tipo A mediante aprendizaje automático [en línea] Tesis de maestría. Montevideo : Udelar. FC - PEDECIBA. 2025 |
| Título Obtenido: | Magíster en Bioinformática |
| Facultad o Servicio que otorga el Título: | Universidad de la República (Uruguay). Facultad de Ciencias - PEDECIBA. |
| Licencia: | Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0) |
| Aparece en las colecciones: | Tesis de posgrado - Facultad de Ciencias |
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | ||
|---|---|---|---|---|---|
| uy24-21982.pdf | 45,35 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons