Please use this identifier to cite or link to this item:
https://hdl.handle.net/20.500.12008/26187
How to cite
Title: | Generación de diálogo utilizando aprendizaje por refuerzo y redes neuronales adversarias |
Authors: | Bello, Andrés Sclavi, Matías |
Obtained title: | Ingeniero en Computación |
University or service that grants the title: | Universidad de la República (Uruguay). Facultad de Ingeniería |
Tutor: | Garat, Diego Moncecchi, Guillermo |
Type: | Tesis de grado |
Keywords: | Generación de diálogo, Aprendizaje por refuerzo, Redes generativas adversarias, Redes neuronales recurrentes |
Issue Date: | 2020 |
Abstract: | El procesamiento de lenguaje natural (PLN) intenta modelar la capacidad de los seres
humanos para comunicarse entre sí. En el marco de esta área, nuestro trabajo tiene
por objetivo la generación de diálogo escrito, particularmente entre dos personas
de diferente género, mediante el uso de aprendizaje por refuerzo y redes generativas
adversarias (GAN). Para lograr este objetivo se construye un corpus que contiene
diálogos de películas en inglés, el cual se utiliza para entrenar dos agentes, uno por
cada género. Ambos agentes están implementados como una tarea de aprendizaje
por refuerzo, donde cada uno está constituido por dos modelos: un generador y un
discriminador. El objetivo del generador es producir las respuestas a los diálogos,
mientras que el discriminador tiene la tarea de distinguir si la respuesta es generada
por un humano o por el modelo. La calidad de las respuestas generadas por los
agentes es evaluada utilizando métricas basadas en heurísticas y mediante evaluación
humana. Los resultados obtenidos en esta última muestran que 45% de las respuestas
no son distinguidas como provenientes del modelo, mientras que las métricas basadas
en heurísticas presentan que los agentes utilizados están por encima de la línea base,
implementada utilizando la similitud semántica de las respuestas. |
Publisher: | Udelar.FI. |
Citation: | Bello, A. y Sclavi, M. Generación de diálogo utilizando aprendizaje por refuerzo y redes neuronales adversarias [en línea] Tesis de grado. Montevideo : Udelar. FI. INCO, 2020. |
License: | Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0) |
Appears in Collections: | Tesis de grado - Instituto de Computación |
This item is licensed under a Creative Commons License