english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/54407 Cómo citar
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorPazos Obregón, Flavio-
dc.contributor.advisorFajardo Rossi, Álvaro-
dc.contributor.authorPérez Valiente, Ramiro Andrés-
dc.date.accessioned2026-04-16T12:21:32Z-
dc.date.available2026-04-16T12:21:32Z-
dc.date.issued2025-
dc.identifier.citationPérez Valiente, R. Herramientas para la vigilancia epidemiológica del virus de Influenza tipo A mediante aprendizaje automático [en línea] Tesis de maestría. Montevideo : Udelar. FC - PEDECIBA. 2025es
dc.identifier.urihttps://hdl.handle.net/20.500.12008/54407-
dc.description.abstractEste trabajo aborda la implementación de modelos de aprendizaje automático para la clasificación de virus Influenza A (VIA) a partir de secuencias de su proteína hemaglutinina (HA), con tres objetivos centrales: identificar el hospedero de origen, predecir el subtipo de HA y detectar automáticamente la patogenicidad viral (HPAI o LPAI). Esta información es clave para la vigilancia genómica y la toma de decisiones sanitarias rápidas ante brotes del virus. En una primera etapa, se desarrollaron y evaluaron modelos supervisados y no supervisados para la clasificación del hospedero (aves, humanos, cerdos), utilizando distintos descriptores de secuencia. Se aplicaron técnicas de reducción de dimensionalidad (PCA, t-SNE) y clustering (KMeans, GMM), que permitieron observar agrupamientos coherentes con los subtipos, especialmente usando los descriptores DPC y Moran. Para desarrollar el clasificador del hospedero se entrenaron modelos supervisados (KNM, SVM, Random Forest, XGBoost), siendo KNN-DPC el modelo más robusto y generalizable, especialmente en la clasificación de secuencias parciales. El análisis de importancia de características reveló regiones funcionales de HA asociadas diferencialmente a cada hospedero, como HR2, epítopo Ca2 y dominio transmembrana en aves; epítopo Sb en humanos; y sitios de clivaje y reconocimiento de ácido siálico en cerdos. En la segunda etapa, se abordó la clasificación del subtipo de HA (entre 16 subtipos) y la detección de motivos de alta o baja patogenicidad. Para ello, se desarrollaron modelos supervisados utilizando nuevamente el descriptor DPC. El algoritmo SVM mostró el mejor desempeño general, manteniendo altos valores de F1-macro y AUC-PR incluso sobre secuencias parciales no contenidas en el entrenamiento. Adicionalmente, se diseñó un script en Python que permite identificar automáticamente la presencia de motivos multibásicos en el sitio del clivaje HA1/HA2, asociados a alta patogenicidad en subtipos H5 y H7. Este script fue validado con secuencias de la epizootia ocurrida en Uruguay (2023), clasificando correctamente todas las variantes como HPAI del clado 2.3.4. Finalmente, los modelos entrenados y el script de patogenicidad se integraron en una plataforma interactiva desarrollada con Stremlit, capaz de procesar secuencias de HA y predecir en tiempo real el hospedero, subtipo y nivel de patogenicidad, constituyendo una herramienta ágil par la vigilancia molecular. En conjunto, estos capítulos demuestran que el uso de descriptores proteicos adecuado, como DPC, combinado con modelos robustos de aprendizaje automático, como SVM y KNN, permite extraer información biológicamente relevante a partir de secuencias virales, con aplicaciones directas en la vigilancia genómica del virus de la Influenza A. Además, los análisis funcionales aportan evidencia sobre regiones moleculares vinculadas al tropismo y la adaptación interespecie, reforzando el valor de estos enfoques en virología y salud pública.es
dc.format.extent114 h.es
dc.format.mimetypeapplication/pdfes
dc.language.isoeses
dc.publisherUdelar. FC.es
dc.rightsLas obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)es
dc.subject.otherENFERMEDADES PRODUCIDAS POR VIRUSes
dc.subject.otherEPIDEMIOLOGIAes
dc.subject.otherVIRUSes
dc.subject.otherAPRENDIZAJE AUTOMATICOes
dc.subject.otherVIRUS INFLUENZAes
dc.titleHerramientas para la vigilancia epidemiológica del virus de Influenza tipo A mediante aprendizaje automáticoes
dc.typeTesis de maestríaes
dc.contributor.filiacionPérez Valiente Ramiro Andrés-
thesis.degree.grantorUniversidad de la República (Uruguay). Facultad de Ciencias - PEDECIBA.es
thesis.degree.nameMagíster en Bioinformáticaes
dc.rights.licenceLicencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)es
Aparece en las colecciones: Tesis de posgrado - Facultad de Ciencias

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
uy24-21982.pdf45,35 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons