Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12008/33944
Cómo citar
Título: | Modelos Seq2Seq para la transcripción de documentos del Archivo Berrutti |
Autor: | Chavat Pérez, Felipe |
Tutor: | Garat, Diego Moncecchi, Guillermo |
Tipo: | Tesis de grado |
Palabras clave: | Aprendizaje profundo, Arquitectura Seq2Seq, Archivo Berrutti, LUISA, OCR |
Fecha de publicación: | 2022 |
Resumen: | Archivo Berrutti es el nombre que recibe un conjunto de documentos generados por las Fuerzas Armadas entre los años 1968 y 1985, años marcados por sucesos de terrorismo de Estado y la reciente dictadura Uruguaya (1973-1985). El Proyecto CRUZAR busca la sistematización de la versión digital del archivo, de forma de facilitar el estudio de la estructura y forma de accionar de los organismos represivos. Es en este marco que el proyecto LUISA (Leyendo Unidos para Interpretar loS Archivos) desarrolla herramientas para semi automatizar esta tarea, como la transcripción automática de las imágenes digitales a un formato procesable por sistemas de extracción de información. El presente trabajo enfoca su estudio en la evaluación de métodos de aprendizaje automático profundo orientado a la transcripción automática de imágenes del Archivo Berrutti, a partir de las transcripciones manuales obtenidas a través de la plataforma LUISA. En particular, se considera la arquitectura Seq2Seq, la cual fue desarrollada en principio para la traducción automática, pero que luego se aplicó a otros problemas, como el OCR, mostrando resultados que compiten con el estado del arte en el tema. El modelo implementado alcanza una tasa de error a nivel de caracteres —CER— del 28.10% frente al 23.74% obtenido por la última herramienta OCR usada por el equipo LUISA y el 52% obtenido por una herramienta anterior. Los resultados son promisorios y alientan a seguir avanzando en la implementación de nuevas características que mejoren el modelo. |
Editorial: | Udelar.FI |
Citación: | Chavat Pérez, F. Modelos Seq2Seq para la transcripción de documentos del Archivo Berrutti [en línea] Tesis de grado. Montevideo : Udelar. FI. INCO, 2022. |
Título Obtenido: | Ingeniero en Computación |
Facultad o Servicio que otorga el Título: | Universidad de la República (Uruguay). Facultad de Ingeniería |
Licencia: | Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0) |
Cobertura geográfica: | Uruguay. |
Aparece en las colecciones: | Tesis de grado - Instituto de Computación |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | ||
---|---|---|---|---|---|
CHA22.pdf | Tesis de grado | 2,34 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons