Integración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes

El potencial de los Modelos de Lenguaje de Gran Tamaño (LLMs como GPT- 4o, Claude, Gemini, Llama, etc.) se ve amenazado por los problemas al obtener respuestas incorrectas o por fuera de un contexto de conocimiento esperado. Técnicas como Retrieval-Augmented Generation (RAG) han surgido como solucio...

Full description

Autores:
Guerrero Sarmiento, Andrés Felipe
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2025
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/75888
Acceso en línea:
https://hdl.handle.net/1992/75888
Palabra clave:
Modelos de Lenguaje de Gran Tamaño (LLMs)
Asistentes Inteligentes
Inteligencia Artificial
Procesamiento del Lenguaje Natural (NLP)
Educación
Retrieval-Augmented Generation (RAG)
Semantic Chunking
Statistical Chunking
Ingeniería
Rights
openAccess
License
Attribution 4.0 International
Description
Summary:El potencial de los Modelos de Lenguaje de Gran Tamaño (LLMs como GPT- 4o, Claude, Gemini, Llama, etc.) se ve amenazado por los problemas al obtener respuestas incorrectas o por fuera de un contexto de conocimiento esperado. Técnicas como Retrieval-Augmented Generation (RAG) han surgido como soluciones prometedoras al potenciar los LLMs, con fuentes de conocimiento externo, para mejorar la precisión y relevancia contextual. Este proyecto investiga la aplicación de RAG en el desarrollo de asistentes inteligentes dentro de una herramienta open source. Se exploran varias técnicas de fragmentación del conocimiento y se realizan casos de estudio donde se evidencia las mejoras en la precisión de las respuestas de los modelos utilizando la fragmentación semántica.