english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/47319 Cómo citar
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorShankar, Adithi-
dc.contributor.authorPlaja-Roglans, Genís-
dc.contributor.authorNuttall, Thomas-
dc.contributor.authorRocamora, Martín-
dc.contributor.authorSerra, Xavier-
dc.coverage.spatialAsia, Sur de la Indiaes
dc.date.accessioned2024-12-02T17:28:34Z-
dc.date.available2024-12-02T17:28:34Z-
dc.date.issued2024-
dc.identifier.citationShankar, A., Plaja-Roglans, G., Nuttall, T. y otros. Saraga Audiovisual : A large multimodal open data collection for the analysis of Carnatic Music [en línea]. EN: 25th International Society for Music Information Retrieval (ISMIR), San Francisco, California, United States, 10-14 nov. 2024, pp. 1-9.es
dc.identifier.urihttps://ismir2024.ismir.net/-
dc.identifier.urihttps://hdl.handle.net/20.500.12008/47319-
dc.description.abstractCarnatic music is a style of South Indian art music whose analysis using computational methods is an active area of research in Music Information Research (MIR). A core, open dataset for such analysis is the Saraga dataset, which includes multi-stem audio, expert annotations, and accompanying metadata. However, it has been noted that there are several limitations to the Saraga collections, and that additional relevant aspects of the tradition still need to be covered to facilitate musicologically important research lines. In this work, we present Saraga Audiovisual, a dataset that includes new and more diverse renditions of Carnatic vocal performances, totalling 42 concerts and more than 60 hours of music. A major contribution of this dataset is the inclusion of video recordings for all concerts, allowing for a wide range of multimodal analyses. We also provide high-quality human pose estimation data of the musicians extracted from the video footage, and perform benchmarking experiments for the different modalities to validate the utility of the novel collection. Saraga Audiovisual, along with access tools and results of our experiments, is made available for research purposes.es
dc.description.sponsorshipEste trabajo fue realizado bajo el marco de "IA y Música: Cátedra en Inteligencia Artificial y Música (TSI-100929-2023-1)", financiado por la Secretaría de Estado de Digitalización e Inteligencia Artificial y la European Union-Next Generation EU, en el marco del programa Cátedras ENIA 2022 para la creación de cátedras universidad-empresa en IA.es
dc.format.extent9 p.es
dc.format.mimetypeapplication/pdfes
dc.language.isoenes
dc.publisherISMIRes
dc.relation.ispartof25th International Society for Music Information Retrieval (ISMIR), San Francisco, California, United States, 10-14 nov. 2024, pp. 1-9.es
dc.rightsLas obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)es
dc.subjectApplicationses
dc.subjectMusic videoses
dc.subjectMultimodal music systemses
dc.subjectEvaluation, datasets, and reproducibilityes
dc.subjectNovel datasets and use caseses
dc.subjectKnowledge-driven approaches to MIRes
dc.subjectComputational ethnomusicologyes
dc.subjectMIR taskses
dc.subjectPattern matching and detectiones
dc.subjectSound source separationes
dc.subjectComputational musicologyes
dc.titleSaraga Audiovisual : A large multimodal open data collection for the analysis of Carnatic Music.es
dc.typePonenciaes
dc.contributor.filiacionShankar Adithi, Universitat Pompeu Fabra-
dc.contributor.filiacionPlaja-Roglans Genís, Universitat Pompeu Fabra-
dc.contributor.filiacionNuttall Thomas, Universitat Pompeu Fabra-
dc.contributor.filiacionRocamora Martín, Universidad de la República (Uruguay). Facultad de Ingeniería.-
dc.contributor.filiacionSerra Xavier, Universitat Pompeu Fabra-
dc.rights.licenceLicencia Creative Commons Atribución (CC - By 4.0)es
udelar.academic.departmentProcesamiento de Señaleses
udelar.investigation.groupProcesamiento de Audio (GPA)es
Aparece en las colecciones: Publicaciones académicas y científicas - Instituto de Ingeniería Eléctrica

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
SPNRS24.pdfVersión publicada6,42 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons