Generative Artificial Intelligence

La generación de datos en la investigación de Visión por Computador (CV) es crucial para mejorar la robustez y adaptabilidad de los sistemas al producir conjuntos de datos que reflejen de cerca las distribuciones del mundo real. Aunque los avances recientes en modelos generativos han mejorado el rea...

Full description

Autores:
Castillo Aguirre, Angela
Tipo de recurso:
Doctoral thesis
Fecha de publicación:
2024
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
eng
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/75576
Acceso en línea:
https://hdl.handle.net/1992/75576
Palabra clave:
Generative Artificial Intelligence
Generative AI
Artificial Intelligence
Computer Vision
Ingeniería
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
Description
Summary:La generación de datos en la investigación de Visión por Computador (CV) es crucial para mejorar la robustez y adaptabilidad de los sistemas al producir conjuntos de datos que reflejen de cerca las distribuciones del mundo real. Aunque los avances recientes en modelos generativos han mejorado el realismo y la personalización de los datos, persisten desafíos en el mantenimiento de la generalización, la consistencia dinámica y la eficiencia computacional. Esta tesis aborda estos desafíos mejorando las capacidades de los modelos generativos en escenarios del mundo real, enfocándose en mejorar la calidad de las imágenes, asegurar la consistencia temporal en la predicción del movimiento humano y optimizar la eficiencia de inferencia en modelos de difusión condicionados por texto. Además, exploramos la generación multimodal mediante la destilación de conocimiento de modelos de difusión en Modelos de Lenguaje Grande (LLMs). Nuestro trabajo cierra la brecha entre la teoría y la práctica, avanzando en la utilidad y escalabilidad de los modelos generativos en diversas aplicaciones.