english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/47091 Cómo citar
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorWonsever, Dina-
dc.contributor.advisorRosá, Aiala-
dc.contributor.authorFernández, Esteban-
dc.contributor.authorFernández, Virginia-
dc.date.accessioned2024-11-15T16:40:45Z-
dc.date.available2024-11-15T16:40:45Z-
dc.date.issued2013-
dc.identifier.citationFernández, E. y Fernández, V. Determinación de la factividad de los eventos mencionados en el texto [en línea]. Tesis de grado. Montevideo : Udelar. FI. INCO, 2013.es
dc.identifier.urihttps://hdl.handle.net/20.500.12008/47091-
dc.description.abstractLa factividad es una propiedad de las referencias a eventos en textos. Un evento puede presentarse como ocurrido u ocurriendo, como no ocurrido u ocurriendo o como de ocurrencia eventual. Para determinarla es necesario observar el contexto donde dicho evento puede estar afectado por elementos de polaridad negativa, por operadores modales, o por predicados que afecten su valor de verdad, o combinaciones de todos estos. Este proyecto aborda el desarrollo de una herramienta cuyo fin es determinar la factividad de un evento mencionado en textos en español utilizando métodos de aprendizaje automático. Para el análisis se cuenta con un corpus anotado por dos estudiantes de lingüística con una sintaxis de anotación llamada SIBILIA, la misma contiene información pertinente sobre el evento y la factividad del mismo. Dado que este corpus era muy pequeño se decidió expandirlo utilizando una primera versión del sistema que etiquetó nuevos textos de noticias y luego fue corregido manualmente por las tutoras. Se toma como base numerosos trabajos previos hechos para diferentes idiomas, entre ellos el inglés y el croata. El corpus mencionado anteriormente se utilizó para entrenar y testear un clasificador basado en los modelos Conditional Random Fields (CRF) y Support Vector Machine (SVM) ya que los mismos han obtenido muy buenos resultados en el área del procesamiento de lenguaje natural. También se realizó una prueba con árboles de decisión sin lograr resultados apropiados. Los resultados obtenidos para los toolkits CRF++ y Yamcha son de 85,1% y 87,4% de Medida F respectivamente, estos superan ampliamente el valor de la línea base (68,5%) aunque todavía queda lugar para mejorar dado que no alcanzan a la línea tope (90,4%). La línea base consiste en un sistema simple basado en reglas que determina la factividad de los eventos en el texto. La línea tope, por otro lado, muestra la concordancia que existe entre las dos estudiantes de lingüística que anotaron manualmente el corpus.es
dc.format.extent111 p.es
dc.format.mimetypeapplication/pdfes
dc.language.isoeses
dc.publisherUdelar.FIes
dc.rightsLas obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)es
dc.subject.otherSISTEMAS DE PROCESAMIENTO DEL LENGUAJE NATURALes
dc.titleDeterminación de la factividad de los eventos mencionados en el texto.es
dc.typeTesis de gradoes
dc.contributor.filiacionFernández Esteban, Universidad de la República (Uruguay). Facultad de Ingeniería.-
dc.contributor.filiacionFernández Virginia, Universidad de la República (Uruguay). Facultad de Ingeniería.-
thesis.degree.grantorUniversidad de la República (Uruguay). Facultad de Ingeniería.es
thesis.degree.nameIngeniero en Computaciónes
dc.rights.licenceLicencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)es
Aparece en las colecciones: Tesis de grado - Instituto de Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
FF13.pdfTesis de grado2,1 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons