Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/20.500.12008/51225
Cómo citar
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.advisor | Tejera, Gonzalo | - |
dc.contributor.advisor | Marzoa, Mercedes | - |
dc.contributor.author | Padrón Simón, Daniel | - |
dc.contributor.author | Estramil Moreira, Edison Steven | - |
dc.contributor.author | Núñez Hosco, Nicolás Alejandro | - |
dc.date.accessioned | 2025-08-21T19:59:55Z | - |
dc.date.available | 2025-08-21T19:59:55Z | - |
dc.date.issued | 2025 | - |
dc.identifier.citation | Padrón Simón, D., Estramil Moreira, E. y Núñez Hosco, N. Sistema de generación de instancias y reducción de carga del etiquetado de imágenes de malezas para detección de objetos [en línea] Tesis de grado. Montevideo : Udelar. FI. INCO, 2025. | es |
dc.identifier.uri | https://hdl.handle.net/20.500.12008/51225 | - |
dc.description.abstract | Técnicas asociadas al área de visión artificial, como la detección de objetos, son ampliamente utilizadas en la búsqueda de la automatización en diversos dominios; en particular, en este trabajo se aplica en lo referido al control de malezas en cultivos. Actualmente, los métodos de detección de objetos más populares, que hacen uso de redes neuronales, requieren de un gran número de imágenes con sus correspondientes etiquetas, conformadas por la clase y localización de cada objeto que se busca detectar. Con el objetivo de mitigar esta limitación, en este trabajo se relevan diversas técnicas orientadas a mejorar el desempeño de modelos de detección sin aumentar el esfuerzo humano, a costa de un mayor uso de poder computacional. Posteriormente, se proponen, implementan y evalúan distintos flujos que a partir de un conjunto de imágenes y un número máximo de imágenes a etiquetar manualmente, devuelven un subconjunto completamente etiquetado, buscando que este sea el más significativo para un modelo de detección, junto con imágenes artificiales autoetiquetadas de los objetos a detectar. Esto permite su libre utilización en futuros entrenamientos de modelos de detección de objetos, sin depender de la arquitectura base utilizada. En particular, los flujos son variaciones en el uso de los diferentes componentes implementados, como modelos difusos para la generación de imágenes, Plug and Play Active Learning (PPAL) para la selección de imágenes, así como YOLOv11m, Faster R-CNN y RetinaNet para la evaluación, todos ellos implementados en Python. El primero de los componentes es una implementación propia de PPAL, el cual, al igual que el resto de las técnicas de aprendizaje activo, realiza la selección de imágenes a etiquetar de forma progresiva, a medida que el modelo es entrenado, con el fin de priorizar el etiquetado de aquellas imágenes que sean más significativas para el entrenamiento del modelo. El segundo de dichos componentes consiste en el entrenamiento de modelos generativos que sean capaces de capturar los detalles de los objetos a detectar, a partir de Stable Diffusion v1.5, utilizando como método de ajuste Dreambooth, a fin de expandir el conjunto de datos de entrenamiento. Por último, las imágenes generadas por el modelo generativo no serían aprovechables para el entrenamiento sin sus etiquetas correspondientes. Por esta razón, y con el fin de no requerir intervención humana para el etiquetado de estas, se propone un último componente, el cual se encargará de etiquetar de forma autónoma las imágenes generadas, utilizando los canales de colores de las imágenes, además de otros métodos que los combinan con el uso de SAM (Segment Anything Model), o mediante modelos de detección en conjunto con filtros que utilizan las imágenes etiquetadas por el usuario. Se evalúa el aumento de rendimiento provisto tanto por cada componente individualmente, como por los flujos que los combinan. Utilizando el conjunto de datos CottonWeedDet12, se compara el rendimiento de diferentes modelos entrenados, primero con las imágenes resultantes de haber aplicado las tres componentes, y luego sobre las imágenes resultantes de no haber aplicado ninguna de estas. Al calcular la mAP@50, el método propuesto obtiene, al utilizar un 5% del conjunto de datos, una mejora de 0,119 en Faster R-CNN, 0,052 en YOLOv11m y 0,191 en RetinaNet con respecto a entrenar el detector sin utilizar las imágenes sintéticas, y mediante selección aleatoria. Al usar un 10% se obtienen mejoras de 0,049 en Faster R-CNN, 0,058 en YOLOv11m y 0,087 en RetinaNet. Por último, al usar un 20 %, se obtienen mejoras de 0,053 en Faster R-CNN, 0,035 en YOLOv11m y 0,034 en RetinaNet. Estos resultados muestran que la metodología presenta una clara mejora en todos los detectores, especialmente en los casos en lo que el número de imágenes es particularmente bajo, lográndolo sin incrementar el esfuerzo humano requerido. | es |
dc.format.extent | 126 p. | es |
dc.format.mimetype | application/pdf | es |
dc.language.iso | es | es |
dc.publisher | Udelar. FI. | es |
dc.rights | Las obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014) | es |
dc.subject | Modelos generativos de imágenes | es |
dc.subject | Reducción de carga de etiquetado | es |
dc.subject | Aprendizaje automático | es |
dc.subject | Aprendizaje activo | es |
dc.subject | Detección de objetos | es |
dc.title | Sistema de generación de instancias y reducción de carga del etiquetado de imágenes de malezas para detección de objetos. | es |
dc.type | Tesis de grado | es |
dc.contributor.filiacion | Padrón Simón Daniel, Universidad de la República (Uruguay). Facultad de Ingeniería. | - |
dc.contributor.filiacion | Estramil Moreira Edison Steven, Universidad de la República (Uruguay). Facultad de Ingeniería. | - |
dc.contributor.filiacion | Núñez Hosco Nicolás Alejandro, Universidad de la República (Uruguay). Facultad de Ingeniería. | - |
thesis.degree.grantor | Universidad de la República (Uruguay). Facultad de Ingeniería | es |
thesis.degree.name | Ingeniero en Computación | es |
dc.rights.licence | Licencia Creative Commons Atribución (CC - By 4.0) | es |
Aparece en las colecciones: | Tesis de grado - Instituto de Computación |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | ||
---|---|---|---|---|---|
PEN25.pdf | Tesis de grado | 8,54 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons