english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/41686 Cómo citar
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorGarat, Diego-
dc.contributor.authorCruces, María Victoria-
dc.contributor.authorFerraro, Nicolás-
dc.date.accessioned2023-12-06T19:13:04Z-
dc.date.available2023-12-06T19:13:04Z-
dc.date.issued2023-
dc.identifier.citationCruces, M. V. y Ferraro, N. Aprendizaje profundo para la anonimización de textos legales [en línea] Tesis de grado. Montevideo: Udelar. FI. INCO, 2023.es
dc.identifier.urihttps://hdl.handle.net/20.500.12008/41686-
dc.description.abstractLas sentencias judiciales contienen datos sensibles sobre los actores involucrados que, dado su carácter público, deben ser anonimizadas para proteger la identidad de las personas. Hoy en día la anonimización de sentencias judiciales se hace de forma manual, proceso que es costoso y propenso a errores. En este contexto, se aplican técnicas de aprendizaje profundo con intención de automatizar el proceso. Para llevar esto a cabo, se trabaja sobre el corpus de sentencias de la Base de Jurisprudencia Nacional recopilado por Garat y Wonserver en “Towards De-identification of Legal Texts”, en donde las sentencias se encuentran anotadas con etiquetas que indican los participantes involucrados. Con el fin de poder diferenciarlos de otras personas como ministros, abogados, doctrinos y ubicaciones que llevan el nombre de personas, se agregan nuevas etiquetas para poder mejorar la capacidad de detección de participantes a anonimizar. Partiendo del conjunto, se implementan dos soluciones: un reconocedor de entidades nombradas basado en Transformers y como prueba de concepto, una red neuronal siamesa acompañada de clustering para vincular las entidades encontradas. El reconocedor alcanza una F1 de 95.3 % al identificar personas involucradas en los hechos de las sentencias (las de interés al anonimizar), representando una mejoría frente a soluciones previas del 3,54 %. En el caso de la red se obtiene un V-measure de 93.3 % y un ARI de 88.2 %, inferiores a resultados existentes.es
dc.format.extent112 p.es
dc.format.mimetypeapplication/pdfes
dc.language.isoeses
dc.publisherUdelar. FI.es
dc.rightsLas obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)es
dc.subjectAnonimizaciónes
dc.subjectSentencias Judicialeses
dc.subjectReconocimiento de entidadeses
dc.subjectVinculación de entidadeses
dc.subjectResolución de coreferenciases
dc.subjectTransformerses
dc.subjectRedes siamesases
dc.subjectClusterizaciónes
dc.titleAprendizaje profundo para la anonimización de textos legales.es
dc.typeTesis de gradoes
dc.contributor.filiacionCruces María Victoria, Universidad de la República (Uruguay). Facultad de Ingeniería.-
dc.contributor.filiacionFerraro Nicolás, Universidad de la República (Uruguay). Facultad de Ingeniería.-
thesis.degree.grantorUniversidad de la República (Uruguay). Facultad de Ingeniería.es
thesis.degree.nameIngeniero en Computación.es
dc.rights.licenceLicencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)es
Aparece en las colecciones: Tesis de grado - Instituto de Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
CF23.pdfTesis de grado12,75 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons