Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12008/36840
Cómo citar
Carreras: | Licenciatura en Matemática |
Código de la carrera: | 65 |
Tipo de la carrera: | Grado |
Unidad Curricular (Programa): | Programa de Seminario: de Bandits |
Código del programa: | MA480_2023 |
Año desde que se dicta: | 2023 |
Fecha de publicación: | 2023 |
Código del plan: | 639 |
Código de unidad curricular (curso): | MA480 |
Objetivos del curso: | Se pretende abordar el estudio del problema de "Bandits" y diferentes variantes, desde la versión más básica de Bandits con k-brazos, hasta las nuevas variantes de Bandits con recompensa por fidelidad. El problema de Bandits se enmarca en lo que se conoce como aprendizaje por refuerzos (Reinforcement Learning), donde un individuo tiene que tomar diferentes decisiones y según la decisión que toma, recibe una recompensa. El objetivo es maximizar esta recompensa. |
Responsable: | Universidad de la República (Uruguay). Facultad de Ciencias. Comisión de Carrera Matemática |
Licencia: | Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0) |
Tipo: | Programa |
Cita: | Universidad de la República (Uruguay). Facultad de Ciencias. Comisión de Carrera Matemática. Programa de Seminario: de Bandits [en linea] 2023. Plan 2014. |
Aparece en las colecciones: | Unidad Curricular (Programas) - Facultad de Ciencias |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | ||
---|---|---|---|---|---|
MA480_2023.pdf | 87,53 kB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons