Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12008/30019
Cómo citar
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.advisor | Chiruzzo, Luis | - |
dc.contributor.author | Giossa, Nicolás | - |
dc.contributor.author | Góngora, Santiago | - |
dc.date.accessioned | 2021-11-01T16:23:09Z | - |
dc.date.available | 2021-11-01T16:23:09Z | - |
dc.date.issued | 2021 | - |
dc.identifier.citation | Giossa, N. y Góngora, S. Construcción de recursos para traducción automática guaraní-español [en línea]. Tesis de grado. Montevideo : Udelar. FI. INCO, 2021. | es |
dc.identifier.uri | https://hdl.handle.net/20.500.12008/30019 | - |
dc.description.abstract | Aunque han pasado varios siglos desde que el guaraní y el español entraron en contacto por primera vez, la traducción automática entre este par de lenguas se mantiene como un tópico de investigación poco explorado dentro de la comunidad científica. Incluso si no nos limitamos a la traducción automática y consideramos todas las tareas de PLN, la escasez de recursos desarrollados para el guaraní se evidencia más aún. Por estar en esta situación, el guaraní es considerada una lengua de escasos recursos. Este trabajo presenta una serie de esfuerzos realizados para fortalecer el desempeño de la traducción automática entre el guaraní y el español, tanto en una dirección como en la otra. Al inicio de nuestra investigación construimos un conjunto paralelo de noticias y uno monolingüe conformado por tweets. El conjunto paralelo construido contiene 15.175 pares de oraciones, mientras que el conjunto monolingüe cuenta con 9.635 tweets. Posteriormente nos centramos en construir representaciones vectoriales de palabras y de su uso, junto al resto de recursos construidos, a la hora de realizar experimentos de traducción automática. En cuanto a los resultados experimentales, si bien los vectores de palabras logran tener buenos resultados tanto en tests intrínsecos como extrínsecos, creemos que la ausencia de diversidad en los textos impacta muy fuertemente en su calidad. Respecto a la traducción automática logramos mejorar resultados previos en la dirección guaraní-español; adicionalmente comparamos nuestro desempeño en el sentido español-guaraní con el de los participantes de la shared task de AmericasNLP, que tuvo lugar en junio de 2021. | es |
dc.format.extent | 86 p. | es |
dc.format.mimetype | application/pdf | es |
dc.language.iso | es | es |
dc.publisher | Udelar.FI | es |
dc.rights | Las obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014) | es |
dc.subject | Guaraní | es |
dc.subject | PLN | es |
dc.subject | Procesamiento de Lenguaje Natural | es |
dc.subject | Traducción automática | es |
dc.subject | Vectores de palabras | es |
dc.subject | Word embeddings | es |
dc.subject | OpenNMT | es |
dc.title | Construcción de recursos para traducción automática guaraní-español | es |
dc.type | Tesis de grado | es |
dc.contributor.filiacion | Giossa Nicolás, Universidad de la República (Uruguay). Facultad de Ingeniería | - |
dc.contributor.filiacion | Góngora Santiago, Universidad de la República (Uruguay). Facultad de Ingeniería | - |
thesis.degree.grantor | Universidad de la República (Uruguay). Facultad de Ingeniería | es |
thesis.degree.name | Ingeniero en Computación | es |
dc.rights.licence | Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0) | es |
Aparece en las colecciones: | Tesis de grado - Instituto de Computación |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | ||
---|---|---|---|---|---|
GG21.pdf | Tesis de grado | 2,19 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons