english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/36840 Cómo citar
Carreras: Licenciatura en Matemática
Código de la carrera: 65
Tipo de la carrera: Grado
Unidad Curricular (Programa): Programa de Seminario: de Bandits
Código del programa: MA480_2023
Año desde que se dicta: 2023
Fecha de publicación: 2023
Código del plan: 639
Código de unidad curricular (curso): MA480
Objetivos del curso: Se pretende abordar el estudio del problema de "Bandits" y diferentes variantes, desde la versión más básica de Bandits con k-brazos, hasta las nuevas variantes de Bandits con recompensa por fidelidad. El problema de Bandits se enmarca en lo que se conoce como aprendizaje por refuerzos (Reinforcement Learning), donde un individuo tiene que tomar diferentes decisiones y según la decisión que toma, recibe una recompensa. El objetivo es maximizar esta recompensa.
Responsable: Universidad de la República (Uruguay). Facultad de Ciencias. Comisión de Carrera Matemática
Licencia: Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
Tipo: Programa
Cita: Universidad de la República (Uruguay). Facultad de Ciencias. Comisión de Carrera Matemática. Programa de Seminario: de Bandits [en linea] 2023. Plan 2014.
Aparece en las colecciones: Unidad Curricular (Programas) - Facultad de Ciencias

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
MA480_2023.pdf87,53 kBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons