english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/55007 Cómo citar
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorIbáñez-Martínez, Laura-
dc.contributor.authorNkama, Chukwuemeka-
dc.contributor.authorPoltronieri, Andrea-
dc.contributor.authorSerra, Xavier-
dc.contributor.authorRocamora, Martín-
dc.date.accessioned2026-05-14T11:43:31Z-
dc.date.available2026-05-14T11:43:31Z-
dc.date.issued2026-
dc.identifier.citationIbáñez-Martínez, L., Nkama, C., Poltronieri, A. y otros. Evaluating disentangled representations for controllable music generation [Preprint]. Publicado en: CASSP 2026 - 2026 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Barcelona, Spain, 03-08 may. 2026, pp. 15092-15096. DOI: 10.1109/ICASSP55912.2026.11461451.es
dc.identifier.urihttps://hdl.handle.net/20.500.12008/55007-
dc.description.abstractRecent approaches in music generation rely on disentangled representations, often labeled as structure and timbre or local and global, to enable controllable synthesis. Yet the underlying properties of these embeddings remain underexplored. In this work, we evaluate such disentangled representations in a set of music audio models for controllable generation using a probing-based framework that goes beyond standard downstream tasks. The selected models reflect diverse un-supervised disentanglement strategies, including inductive biases, data augmentations, adversarial objectives, and staged training procedures. We further isolate specific strategies to analyze their effect. Our analysis spans four key axes: informativeness, equivariance, invariance, and disentanglement, which are assessed across datasets, tasks, and controlled transformations. Our findings reveal inconsistencies between intended and actual semantics of the embeddings, suggesting that current strategies fall short of producing truly disentangled representations, and prompting a re-examination of how controllability is approached in music generation.es
dc.description.sponsorshipEste trabajo ha recibido el apoyo de IA y Música : Cátedra en Inteligencia Artificial y Música (TSI-100929-2023-1), financiado por la Secretaría de Estado de Digitalización e Inteligencia Artificial y la Unión Europea (Next Generation EU), e IMPA : Multimodal AI for Audio Processing (PID2023-152250OB-I00), financiado por el Ministerio de Ciencia, Innovación y Universidades del Gobierno español, la Agencia Estatal de Investigación (AEI) y cofinanciado por la Unión Europea.es
dc.format.extent5 p.es
dc.format.mimetypeapplication/pdfes
dc.language.isoenes
dc.rightsLas obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)es
dc.subjectDisentangled representationses
dc.subjectControllable music generationes
dc.subjectEvaluation frameworkes
dc.titleEvaluating disentangled representations for controllable music generationes
dc.typePreprintes
dc.contributor.filiacionIbáñez-Martínez Laura, Universitat Pompeu Fabra, Barcelona, Spain-
dc.contributor.filiacionNkama Chukwuemeka, Universitat Pompeu Fabra, Barcelona, Spain-
dc.contributor.filiacionPoltronieri Andrea, Universitat Pompeu Fabra, Barcelona, Spain-
dc.contributor.filiacionSerra Xavier, Universitat Pompeu Fabra, Barcelona, Spain-
dc.contributor.filiacionRocamora Martín, Universidad de la República (Uruguay). Facultad de Ingeniería.-
dc.rights.licenceLicencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)es
Aparece en las colecciones: Publicaciones académicas y científicas - Instituto de Ingeniería Eléctrica

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
INPSR26.pdfPreprint184,91 kBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons