Identificación de opiniones de diferentes fuentes en textos en español

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/2980 Cómo citar

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.advisor	Minel, Jean-Luc	es
dc.contributor.advisor	Wonsever, Dina	es
dc.contributor.author	Rosá Furman, Aiala	es
dc.date.accessioned	2014-11-24T22:37:15Z	-
dc.date.available	2014-11-24T22:37:15Z	-
dc.date.issued	2011	es
dc.date.submitted	20141202	es
dc.identifier.citation	ROSÁ FURMAN, A. "Identificación de opiniones de diferentes fuentes en textos en español". Tesis de doctorado, Universidad de la República (Uruguay). Facultad de Ingeniería. Instituto de Computación – PEDECIBA, 2011.	es
dc.identifier.uri	http://hdl.handle.net/20.500.12008/2980	-
dc.description.abstract	Este documento presenta un estudio de las expresiones que transmiten opiniones de diferentes fuentes en textos en español. El trabajo incluye la definición de un modelo para los predicados de opinión y sus argumentos (la fuente, el asunto y el mensaje), la creación de un léxico de predicados de opinión que tienen asociada nformación proveniente del modelo y la realización de tres sistemas informáticos. Desarrollamos un primer sistema, basado en reglas contextuales, que obtiene valores de medida F parcial (incluyendo entre los elementos correctos los elementos reconocidos en forma parcial) satisfactorios: 92 % para el predicado, 81 % para la fuente, 75 % para el asunto, 89 % para el mensaje y 85 % para la opinión completa. En particular, para el reconocimiento de la fuente se obtuvo un 79 % de medida F exacta (sin incluir elementos reconocidos en forma parcial). El segundo sistema desarrollado se basa en el modelo Conditional Random Fields (CRF) y se realizó solo para el reconocimiento de las fuentes. El sistema alcanza un valor de medida F exacta de 76 %. Un tercer sistema, que combina las dos técnicas anteriores incorporando la salida del sistema de reglas para el reconocimiento de fuentes como un nuevo atributo del sistema basado en CRF, mejora sensiblemente los resultados obtenidos por los dos sistemas anteriores: 83 % de medida F exacta. En cuanto al reconocimiento de las fuentes de las opiniones, nuestro sistema obtiene resultados muy satisfactorios (83 % de medida F exacta), si tomamos como referencia trabajos realizados para otros idiomas que pueden considerarse similares al nuestro, si bien presentan varias diferencias en su enfoque y su alcance.	es
dc.description.abstract	Estos trabajos alcanzan valores de medida F (exacta o parcial) que se sitúan entre 63 % y 89,5 %. Por otro lado, durante el desarrollo de esta tesis generamos diversos recursos de utilidad para el procesamiento automático del español: un léxico de predicados de opinión, un corpus de 13.000 palabras anotado con las opiniones y sus elementos y un corpus de 40.000 palabras anotado con los predicados de opinión y sus fuentes.	es
dc.format.extent	193 p.	es
dc.format.mimetype	application/pdf	es
dc.language	es	es
dc.publisher	UR. FI-INCO,	es
dc.rights	Las obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad De La República. (Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)	es
dc.subject	Procesamiento del Lenguaje Natural	es
dc.subject	Minería de Opiniones	es
dc.subject	Discurso Reproducido	es
dc.subject	Reglas Contextuales	es
dc.subject	Conditional Random Fields	es
dc.title	Identificación de opiniones de diferentes fuentes en textos en español	es
dc.type	Tesis de doctorado	es
thesis.degree.grantor	Universidad de la República (Uruguay). Facultad de Ingeniería. Instituto de Computación – PEDECIBA	es
thesis.degree.name	Doctor en Informática	es
dc.rights.licence	Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)	es
Aparece en las colecciones:	Tesis de posgrado - Instituto de Computación

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
tesisd-rosa.pdf		860,95 kB	Adobe PDF	Visualizar/Abrir

Mostrar el registro sencillo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons