english Icono del idioma   español Icono del idioma  

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12008/55479 Cómo citar
Título: Estudio de reputación a partir de comentarios extraídos de redes sociales
Autor: Cardozo, Diego
Mori, Martín
Tambucho, Martín
Tutor: Rosá, Aiala
Tipo: Tesis de grado
Fecha de publicación: 2017
Resumen: En los últimos años, el análisis de sentimiento (área de investigación del Procesamiento del Lenguaje Natural) y las técnicas de aprendizaje automático han cobrado una gran importancia a nivel académico y comercial. Esto ha sido fundamentalmente impulsado por la gran cantidad de información y datos que pueden ser extraídos desde las redes sociales. En el presente proyecto se implementa un sistema de análisis de sentimiento para realizar un estudio de reputación a partir de comentarios extraídos de la red social Twitter. Para realizar esta tarea primero se construye un corpus anotado de tweets escritos en Uruguay; luego de que este corpus es confeccionado, un conjunto de usuarios procede a anotar manualmente los tweets, determinando si cada uno se trata o no de una opinión. En caso afirmativo, procede a clasificarla como positiva, negativa o neutral. Mediante un proceso de aprendizaje sobre los datos generados por los anotadores, un conjunto de algoritmos son entrenados para clasificar tweets automáticamente. Este conjunto se compone de tres algoritmos basados en reglas y seis clasificadores basados en los siguientes métodos de aprendizaje automático: Naive Bayes, árboles de decisión, SVM, KNN, regresión logística y redes neuronales. Naive Bayes y redes neuronales obtienen los mejores resultados con una medida F1 de 68% y 69% respectivamente. Finalmente, se utiliza el clasificador de redes neuronales ya entrenado para realizar un estudio de la reputación de un conjunto de entidades o temas destacados. Para ello se descargan los tweets de dichas entidades y se procede a ejecutar el clasificador, graficando la evolución de la reputación de las mismas en el tiempo. Las entidades elegidas fueron: el deportista Emiliano Lasa en el contexto de las instancias finales de una competencia de salto largo; Maria Noel Riccetto, ganadora de un importante premio de Ballet; Verónica Alonso y Raúl Sendic en un período de tiempo en el cual fueron implicados en distintos escándalos políticos. Adicionalmente, se realizó el análisis de reputación de la Selección Uruguaya de Fútbol sub 20 cuando la misma fuera eliminada del mundial de fútbol. Todos los resultados obtenidos fueron coherentes con el contexto particular de cada caso. Por otro lado, durante el desarrollo del proyecto se utilizaron dos lexicones: el primero de palabras con sentimientos marcados, el cual fue expandido con jerga uruguaya y el segundo con patrones de frases que asisten en el proceso para determinar si un tweet es una opinión. Los mencionados recursos, junto con el corpus anotado y los programas implementados podrán ser reutilizados en futuros proyectos.
Editorial: Udelar.FI
Citación: Cardozo, D., Mori, M. y Tambucho, M. Estudio de reputación a partir de comentarios extraídos de redes sociales [en línea]. Tesis de grado. Montevideo : Udelar. FI. INCO, 2017.
Título Obtenido: Ingeniero en Computación
Facultad o Servicio que otorga el Título: Universidad de la República (Uruguay). Facultad de Ingeniería.
Licencia: Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
Aparece en las colecciones: Tesis de grado - Instituto de Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato   
CMT17.pdfTesis de grado2,9 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons