english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/52772 Cómo citar
Título: Representación de palabras en espacios de vectores
Autor: Azzinnari, Agustín
Martínez, Alejandro
Tutor: Etcheverry, Mathías
Wonsever, Dina
Tipo: Tesis de grado
Descriptores: LENGUA ESPAÑOLA, VECTORES, INTERNET
Fecha de publicación: 2016
Resumen: En el presente documento se describe el trabajo realizado en el marco del proyecto de grado “Representación de Palabras en Espacios de Vectores”. Dicho proyecto buscó realizar una evaluación y comparación de las principales técnicas para la generación de representaciones vectoriales de palabras aplicadas al idioma español, haciendo especial énfasis en la experimentación directa con las mismas. Dado que las técnicas estudiadas requieren grandes cantidades de texto para su buen funcionamiento, se investigaron y aplicaron técnicas para la extracción masiva de texto de Internet. A su vez, se construyó una herramienta web para simplificar las tareas de entrenamiento y evaluación de los vectores generados. Dicha herramienta permite también realizar consultas complejas sobre el corpus construido y centraliza todas las tareas de extracción de texto de Internet. Para la evaluación de las representaciones vectoriales se tradujeron al español los principales conjuntos de prueba de la literatura y se propusieron además una serie de casos de prueba novedosos como complemento a los ya existentes. Como resultado se presenta un corpus en idioma español de más de seis mil millones de palabras, junto con una herramienta de código abierto que permite generar y evaluar vectores de palabras utilizando diversos algoritmos del estado del arte del campo. La evaluación de las representaciones generadas arrojó, asimismo, resultados comparables a los obtenidos en la literatura para el idioma inglés.
Editorial: Udelar.FI.
Citación: Azzinnari, A. y Martínez, A. Representación de palabras en espacios de vectores. [en línea]. Tesis de grado. Montevideo : Udelar. FI. INCO, 2016.
Título Obtenido: Ingeniero en Computación
Facultad o Servicio que otorga el Título: Universidad de la República (Uruguay). Facultad de Ingeniería.
Licencia: Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
Aparece en las colecciones: Tesis de grado - Instituto de Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
AM16.pdfTesis de grado1,44 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons