english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/52370 Cómo citar
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorRosá, Aiala-
dc.contributor.advisorPrada, Juan José-
dc.contributor.authorEspíndola, Cindy-
dc.date.accessioned2025-11-07T16:28:35Z-
dc.date.available2025-11-07T16:28:35Z-
dc.date.issued2024-
dc.identifier.citationEspíndola, C. Extracción de fuentes de opinión a partir de textos de prensa uruguaya [en línea] Tesis de grado. Montevideo : Udelar. FI. INCO, 2024.es
dc.identifier.urihttps://hdl.handle.net/20.500.12008/52370-
dc.description.abstractEn documentos de prensa escrita frecuentemente se incluyen opiniones emitidas por los principales involucrados, ya sean personas u organizaciones. Es por esto que resulta de utilidad poder realizar un procesamiento automático de documentos de prensa para detectar estas opiniones y sus fuentes. En este trabajo se tiene como foco una parte del proceso de extracción de esta información: la identificación de las fuentes de opinión. Se modela la tarea como una clasificación de secuencias, procesando cada oración y etiquetando las palabras conforme pertenecen o no a la(s) fuente(s) de opinión en caso de existir. Se hizo uso de la arquitectura Transformer y modelos existentes basados en lenguaje español, realizando un fine tuning con nuevos ejemplos para ajustar estos modelos a la tarea mencionada. Se realizó la comparación entre el uso del modelo de lenguaje para el español habitualmente utilizado, BETO, y un modelo generado específicamente a partir de documentos de prensa uruguaya, ROUBERTA. Como parte de la evaluación, además se consideraron varias alternativas cambiando algunos de sus hiperparámetros. Por otro lado, se utilizó un modelo de lenguaje generativo open source para realizar algunas pruebas con el fin de evaluar si es posible prescindir del entrenamiento con un conjunto anotado en forma manual, para en su lugar utilizar prompts con un conjunto muy limitado de ejemplos. Esto dio como resultado respuestas poco predecibles y dificultades por parte del modelo para cumplir con la tarea y formato establecidos. Se pudo comprobar que, de las opciones vistas con ambos modelos a los cuales se aplicó fine tuning, se obtienen resultados relativamente similares. Los resultados evaluados sobre el conjunto de testeo presentaron una medida F exacta de 81.1 % con los modelos basados en ROUBERTA y 75.4 % con los modelos basados en BETO. Esto demuestra que, a pesar de haber tenido un corpus de datos significativamente menor durante su preentrenamiento, el utilizar un modelo preentrenado con el mismo dominio específico de la tarea a realizar permite obtener muy buenos resultados.es
dc.format.extent50 p.es
dc.format.mimetypeapplication/pdfes
dc.language.isoeses
dc.publisherUdelar. FI.es
dc.rightsLas obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)es
dc.subjectTransformerses
dc.subjectExtracción de opinioneses
dc.subjectSequence labellinges
dc.subjectProcesamiento de lenguaje naturales
dc.titleExtracción de fuentes de opinión a partir de textos de prensa uruguayaes
dc.typeTesis de gradoes
dc.contributor.filiacionEspíndola Cindy, Universidad de la República (Uruguay). Facultad de Ingeniería.-
thesis.degree.grantorUniversidad de la República (Uruguay). Facultad de Ingenieríaes
thesis.degree.nameLicenciado en Computaciónes
dc.rights.licenceLicencia Creative Commons Atribución (CC - By 4.0)es
Aparece en las colecciones: Tesis de grado - Instituto de Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
Esp24.pdfTesis de grado1,97 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons