english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/53496 Cómo citar
Título: Restauración de grabaciones musicológicas mediante técnicas de denoising : Sustracción espectral y Aprendizaje profundo
Autor: Arimón, Analía
Mazzeo, Guillermo
Torrado, Rodrigo
Tutor: Irigaray, Ignacio
Silvera Coeff, Diego
Tipo: Tesis de grado
Palabras clave: Denoising, Grabaciones Musicológicas, Aprendizaje Profundo, Sustracción Espectral, Denoisify
Fecha de publicación: 2025
Resumen: Este trabajo aborda la restauración de grabaciones musicales de cinta analógica mediante técnicas de reducción de ruido (denoising), combinando enfoques clásicos de procesamiento de señales con estrategias modernas basadas en aprendizaje profundo. El proyecto surge de la necesidad de preservar el acervo sonoro del Centro Nacional de Documentación Musical Lauro Ayestarán, que reúne grabaciones de campo y de estudio afectadas por la degradación propia de los medios magnéticos y las limitaciones tecnológicas de su época. El objetivo principal consistió en desarrollar, implementar y comparar dos enfoques representativos para la reducción de ruido en grabaciones musicales: (1) un sistema automatizado de sustracción espectral, que incluye mejoras orientadas a la restauración musical —como modelado armónico/percusivo, análisis sinusoidal, un esquema iterativo de atenuación progresiva y un detector automático de inactividad de señal—, y (2) un modelo de aprendizaje profundo basado en arquitecturas U-Net de dos etapas, entrenadas con diferentes bases de datos de ruido (MagTapeDB, con ruido de cinta magnética, y grabaciones de gramófono). Los entrenamientos se realizaron en el ClusterUY, considerando limitaciones de hardware y explorando la influencia del dominio del ruido sobre la capacidad de generalización de los modelos. La evaluación experimental combinó métricas perceptuales objetivas (PEAQ y PAQM), análisis por tipo de contenido musical, variación según la relación señal–ruido (10 dB y 16 dB), tiempos de procesamiento, y escucha crítica cualitativa. Los resultados demuestran que las técnicas clásicas de procesamiento de señales continúan ofreciendo un rendimiento altamente competitivo. En particular, la sustracción espectral —tanto en su versión estándar como alternativa— logra un equilibrio sólido entre calidad perceptual, estabilidad y eficiencia computacional, manteniendo un desempeño consistente en diversos escenarios, aunque la técnica presente artefactos conocidos como el ruido musical. Por otro lado, los modelos de aprendizaje profundo muestran un comportamiento más variable: alcanzan resultados competitivos cuando el tipo de ruido y el contenido de las señales coincide con el utilizado en el entrenamiento, pero experimentan una degradación significativa al enfrentarse a dominios no representados. Además, tienden a eliminar transitorios y componentes de alta frecuencia, introduciendo una cierta artificialidad perceptual. Esto evidencia tanto la dependencia de los modelos respecto a los datos de entrenamiento como la limitada explicabilidad de sus decisiones. Desde el punto de vista práctico, las técnicas basadas en redes neuronales requieren recursos computacionales elevados, tiempos de entrenamiento prolongados y conocimientos especializados para su ajuste y validación, lo cual contrasta con la simplicidad y robustez de los métodos clásicos. En conjunto, los resultados permiten concluir que las técnicas clásicas siguen siendo una herramienta eficaz y accesible para la restauración de grabaciones patrimoniales, mientras que los enfoques basados en aprendizaje profundo, aunque prometedores, requieren adaptaciones específicas para alcanzar una calidad perceptual comparable en contextos reales y diversos.
Descripción: Títulos obtenidos: Analía Arimón, Ingeniera en Sistemas de Comunicación; Rodrigo Torrado, Ingeniero en Sistemas de Comunicación; Guillermo Mazzeo, Ingeniero Electricista.
Editorial: Udelar.FI.
Citación: Arimón, A., Mazzeo, G. y Torrado, R. Restauración de grabaciones musicológicas mediante técnicas de denoising : Sustracción espectral y Aprendizaje profundo [en línea]. Tesis de grado. Montevideo : Udelar. FI. IIE, 2025.
Título Obtenido: Ingeniero Electricista e Ingeniero en Sistemas de Comunicación
Facultad o Servicio que otorga el Título: Universidad de la República (Uruguay). Facultad de Ingeniería.
Licencia: Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
Aparece en las colecciones: Tesis de grado - Instituto de Ingeniería Eléctrica

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
AMT25.pdfTesis de grado26,81 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons