english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/54502 Cómo citar
Título: Generación de poses de lengua de señas a partir de descripciones en lenguaje natural de símbolos HamNoSys
Autor: Máximo Caram, Santiago
Tutor: Chiruzzo, Luis
Rosá, Aiala
Tipo: Tesis de maestría
Palabras clave: Producción de Lengua de Señas, HamNoSys, LLM, VQ-VAE, Instruction Tuning
Fecha de publicación: 2025
Resumen: Las lenguas de señas, utilizadas por millones de personas, son lenguajes naturales con una gramática y un léxico propios, independientes de los lenguajes orales. A pesar de los avances de los últimos años, la producción automática de lengua de señas sigue siendo un desafío. Esta tesis investiga inicialmente el uso de modelos generativos para mejorar la producción de lengua de señas, para luego centrarse específicamente en la generación de secuencias de poses a partir de la notación The Hamburg Sign Language Notation System (HamNoSys). El método propuesto consta de tres componentes: (1) un generador de descripciones que traduce símbolos HamNoSys a lenguaje natural, (2) un Large Language Model (LLM) ajustado con Instruction Tuning para convertir estas descripciones en secuencias discretas de poses y (3) una red Vector Quantized Variational Autoencoder (VQ-VAE) para codificar y decodificar las poses. Esta combinación transforma la traducción de HamNoSys a poses en una tarea de generación condicionada por texto. Los resultados experimentales muestran que este enfoque logra un desempeño comparable a trabajos previos, validando así la metodología propuesta. No obstante, persisten desafíos en la precisión de las poses, especialmente en las configuraciones de las manos. Se proponen futuras líneas de investigación, como la exploración de arquitecturas alternativas, y el ajuste de las técnicas de discretización de poses. Además, esta investigación contribuye a la creación de diccionarios en lenguaje natural de símbolos HamNoSys, mejorando la accesibilidad, y abre oportunidades para el desarrollo de aplicaciones multimodales en la generación de movimiento humano, como la síntesis de gestos.
Editorial: Udelar.FI.
Citación: Máximo Caram, S. Generación de poses de lengua de señas a partir de descripciones en lenguaje natural de símbolos HamNoSys [en línea] Tesis de maestría. Montevideo : Udelar. FI, 2025.
ISSN: 1688-2792
Título Obtenido: Magister en Ciencia de Datos y Aprendizaje Automático
Facultad o Servicio que otorga el Título: Universidad de la República (Uruguay). Facultad de Ingeniería
Licencia: Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
Aparece en las colecciones: Tesis de Posgrado - Facultad de Ingeniería

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
Max25.pdfTesis de Maestría8,27 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons