Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12008/54502
Cómo citar
| Título: | Generación de poses de lengua de señas a partir de descripciones en lenguaje natural de símbolos HamNoSys |
| Autor: | Máximo Caram, Santiago |
| Tutor: | Chiruzzo, Luis Rosá, Aiala |
| Tipo: | Tesis de maestría |
| Palabras clave: | Producción de Lengua de Señas, HamNoSys, LLM, VQ-VAE, Instruction Tuning |
| Fecha de publicación: | 2025 |
| Resumen: | Las lenguas de señas, utilizadas por millones de personas, son lenguajes naturales con una gramática y un léxico propios, independientes de los lenguajes orales. A pesar de los avances de los últimos años, la producción automática de lengua de señas sigue siendo un desafío.
Esta tesis investiga inicialmente el uso de modelos generativos para mejorar la producción de lengua de señas, para luego centrarse específicamente en la generación de secuencias de poses a partir de la notación The Hamburg Sign Language Notation System (HamNoSys).
El método propuesto consta de tres componentes: (1) un generador de descripciones que traduce símbolos HamNoSys a lenguaje natural, (2) un Large Language Model (LLM) ajustado con Instruction Tuning para convertir estas descripciones en secuencias discretas de poses y (3) una red Vector Quantized
Variational Autoencoder (VQ-VAE) para codificar y decodificar las poses. Esta combinación transforma la traducción de HamNoSys a poses en una tarea de generación condicionada por texto.
Los resultados experimentales muestran que este enfoque logra un desempeño comparable a trabajos previos, validando así la metodología propuesta.
No obstante, persisten desafíos en la precisión de las poses, especialmente en las configuraciones de las manos. Se proponen futuras líneas de investigación, como la exploración de arquitecturas alternativas, y el ajuste de las técnicas de discretización de poses.
Además, esta investigación contribuye a la creación de diccionarios en lenguaje natural de símbolos HamNoSys, mejorando la accesibilidad, y abre oportunidades para el desarrollo de aplicaciones multimodales en la generación de movimiento humano, como la síntesis de gestos. |
| Editorial: | Udelar.FI. |
| Citación: | Máximo Caram, S. Generación de poses de lengua de señas a partir de descripciones en lenguaje natural de símbolos HamNoSys [en línea] Tesis de maestría. Montevideo : Udelar. FI, 2025. |
| ISSN: | 1688-2792 |
| Título Obtenido: | Magister en Ciencia de Datos y Aprendizaje Automático |
| Facultad o Servicio que otorga el Título: | Universidad de la República (Uruguay). Facultad de Ingeniería |
| Licencia: | Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0) |
| Aparece en las colecciones: | Tesis de Posgrado - Facultad de Ingeniería |
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | ||
|---|---|---|---|---|---|
| Max25.pdf | Tesis de Maestría | 8,27 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons