english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/3094 Cómo citar
Título: Un Jugador de Go : basado en técnicas de aprendizaje automático
Autor: Garreta Tompson, Raúl
Título Obtenido: Ingeniero en Computación
Facultad o Servicio que otorga el Título: Universidad de la República (Uruguay). Facultad de Ingeniería. Instituto de Computación
Tutor: Garat Baridon, Diego
Moncecchi, Guillermo
Tipo: Tesis de grado
Palabras clave: INDUCCION DE PROGRAMAS LOGICOS, REDES NEURONALES, APRENDIZAJE POR DIFERENCIA TEMPORAL, GO.
Fecha de publicación: 2006
Resumen: Desde los comienzos de la investigación en Inteligencia Artificial (IA), los juegos han sido utilizados como campo de investigación para la prueba y desarrollo de nuevos algoritmos, técnicas y heurísticas para la resolución de problemas. Esto se debe a que brindan reglas claras del problema, pero manteniendo una complejidad lo suficiente como para hacer que no sea trivialmente resuelto. Luego del Ajedrez, el Go se ha llevado la mayoría de los esfuerzos para su resolución. Sin embargo, al día no existe ninguna máquina que pueda derrotar a un jugador humano profesional de Go. Por este motivo, la resolución del Go es considerada como uno de los retos en el campo de la IA. Gran parte de la complejidad del Go se debe a que dada una posición, existen muchos movimientos posibles, por lo que analizarlos todos con gran profundidad y corto tiempo de respuesta es muy difícil. Otro problema reside en la dificultad de encontrar una función que permita evaluar una posición y decidir cual movimiento es más favorable. En este proyecto se propone investigar y diseñar un jugador de Go basado en técnicas de Aprendizaje Automático. Por un lado, se desarrolla un sistema de aprendizaje de patrones basado en Inducción de Programas Lógicos. Los patrones inducidos se utilizan para generar un conjunto reducido de movimientos adecuados para analizar cada vez que se decide que movimiento realizar. Por otro lado, se desarrolla una Red Neuronal cuyo objetivo es aprender una función que evalúe posiciones de Go. Para esto se utiliza Diferencia Temporal como algoritmo de aprendizaje y Backpropagation como algoritmo de ajuste de la red. Ambos acercamientos son combinados en la implementación de un jugador artificial de Go. Los resultados son promisorios: se ha logrado una buena performance ante otros jugadores artificiales.
Editorial: UR. FI-INCO,
Citación: GARRETA TOMPSON, R. "Un Jugador de Go : basado en técnicas de aprendizaje automático". Tesis de grado, Universidad de la República (Uruguay). Facultad de Ingeniería. Instituto de Computación, 2006.
Licencia: Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)
Aparece en las colecciones: Tesis de grado - Instituto de Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
tg-garreta.pdf1,17 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons