english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/20294 Cómo citar
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorMotz, Regina-
dc.contributor.authorAnzorena, Pablo-
dc.contributor.authorLaguarda, Manuel-
dc.contributor.authorOlivera, Bruno-
dc.coverage.spatialUruguayes
dc.date.accessioned2019-03-20T16:16:23Z-
dc.date.available2019-03-20T16:16:23Z-
dc.date.issued2018-
dc.identifier.citationAnzorena, P, Laguarda, M y Olivera, B. Extracción de eventos en prensa escrita uruguaya del siglo XIX [en línea] Tesis de grado. Montevideo : UR.FI.INCO, 2018.es
dc.identifier.urihttp://hdl.handle.net/20.500.12008/20294-
dc.description.abstractEn este proyecto, se plantea el diseño y la implementación de un sistema de extracción de eventos en prensa uruguaya del siglo XIX digitalizados en formato de imagen, generando clusters de eventos agrupados según su similitud semántica. La solución propuesta se divide en 4 módulos: módulo de preprocesamiento compuesto por el OCR y un corrector de texto, módulo de extracción de eventos implementado en Python y utilizando Freeling1, módulo de clustering de eventos implementado en Python utilizando Word Embeddings y por último el módulo de etiquetado de los clusters también utilizando Python. Debido a la cantidad de ruido en los datos que hay en los diarios antiguos, la evaluación de la solución se hizo sobre datos de prensa digital de la actualidad. Se evaluaron diferentes medidas a lo largo del proceso. Para la extracción de eventos se logró conseguir una Precisión y Recall de un 56% y 70% respectivamente. En el caso del módulo de clustering se evaluaron las medidas de Silhouette Coefficient, la Pureza y la Entropía, dando 0.01, 0.57 y 1.41 respectivamente. Finalmente se etiquetaron los clusters utilizando como etiqueta las secciones de los diarios de la actualidad, realizándose una evaluación del etiquetado.es
dc.format.extent85 p.es
dc.format.mimetypeapplication/pdfen
dc.language.isoeses
dc.publisherUR.FI.INCOes
dc.rightsLas obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)es
dc.subjectSistema de extracción de eventoses
dc.subjectClusters de eventoses
dc.subjectPrensa uruguayaes
dc.subjectPythones
dc.titleExtracción de eventos en prensa escrita uruguaya del siglo XIXes
dc.typeTesis de gradoes
dc.contributor.filiacionAnzorena Pablo, Universidad de la República (Uruguay). Facultad de Ingeniería-
dc.contributor.filiacionLaguarda Manuel, Universidad de la República (Uruguay). Facultad de Ingeniería-
dc.contributor.filiacionOlivera Bruno, Universidad de la República (Uruguay). Facultad de Ingeniería-
thesis.degree.grantorUniversidad de la República (Uruguay). Facultad de Ingenieríaes
thesis.degree.nameIngeniero en Computaciónes
dc.rights.licenceLicencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC - By-NC-ND)es
Aparece en las colecciones: Tesis de grado - Instituto de Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
tg-anzorena-laguarda-olivera.pdf2,01 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons