Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12008/33366
Cómo citar
Título: | Construcción de recursos lingüísticos para una gramática HPSG para el español |
Autor: | Chiruzzo, Luis |
Tutor: | Wonsever, Dina |
Tipo: | Tesis de maestría |
Palabras clave: | HPSG, Español, Corpus, Parsing, Supertagging |
Fecha de publicación: | 2015 |
Resumen: | En este trabajo se presenta la construcción de recursos lingüísticos para trabajar con una gramática HPSG para el español. HPSG es un formalismo gramatical rico debido a que el resultado del análisis sintáctico con este formalismo es una representación de la oración que incluye información tanto sintáctica como semántica. Para el idioma inglés existen parsers estadísticos HPSG de alta performance y cobertura del idioma, pero para el español las herramientas existentes aún no llegan al mismo nivel. Se describe una gramática HPSG para el español, indicando sus estructuras de rasgos principales y sus reglas de combinación de expresiones. Se construyó un corpus de árboles HPSG para el español utilizando la gramática definida. Para esto, se partió del corpus AnCora y se transformaron las oraciones mediante un proceso automático, obteniendo como resultado un nuevo corpus etiquetado según el formalismo HPSG. Las heurísticas de transformación tienen un 95,3% de precisión en detección de núcleos y un 92,5% de precisión en clasificación de argumentos. A partir del corpus se definieron las entradas léxicas y se agruparon las entradas de las categorías léxicas de mayor complejidad combinatoria (verbos, nombres y adjetivos) según su comportamiento sintáctico-semántico. Estas agrupaciones de entradas léxicas se denominan frames léxicos. A partir de esto se construyó un supertagger para identificar los frames léxicos más probables dadas las palabras de una oración. El supertagger tiene un accuracy de 83,58% para verbos, 85,78% para nombres y 81,40% para adjetivos (considerando las tres etiquetas más probables). |
Editorial: | Udelar. FI. |
Citación: | Chiruzzo, L. Construcción de recursos lingüísticos para una gramática HPSG para el español [en línea] Tesis de maestría. Montevideo : Udelar. FI. INCO : PEDECIBA. Área Informática, 2015. |
ISSN: | 1688-2792 |
Título Obtenido: | Magíster en Informática |
Facultad o Servicio que otorga el Título: | Universidad de la República (Uruguay). Facultad de Ingeniería |
Licencia: | Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0) |
Aparece en las colecciones: | Tesis de posgrado - Instituto de Computación |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | ||
---|---|---|---|---|---|
Chi15.pdf | Tesis de Maestría | 707,39 kB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons