Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG

El trabajo de grado desarrolla un sistema web para el Grupo de Automática de la Universidad Nacional(GAUNAL) que permite responder a preguntas específicas y generales de un usuario mediante la utilización de documentos académicos mediante la integración de Modelos Grandes de Lenguaje (LLMs), bases d...

Full description

Autores:
Huguet Ospina, Juan José
Tipo de recurso:
Fecha de publicación:
2024
Institución:
Politécnico Colombiano Jaime Izasa Cadavid
Repositorio:
ICARUS
Idioma:
spa
OAI Identifier:
oai:repositorio.elpoli.edu.co:123456789/9027
Acceso en línea:
https://repositorio.elpoli.edu.co/handle/123456789/9027
Palabra clave:
Búsqueda electrónica de recursos de información
Investigación científica
Universidad Nacional de Colombia. Grupo de Automática
Generación aumentada recolectada
LangChain
Python
ChromaDB
Rights
License
http://creativecommons.org/licenses/by-nc/4.0/
Description
Summary:El trabajo de grado desarrolla un sistema web para el Grupo de Automática de la Universidad Nacional(GAUNAL) que permite responder a preguntas específicas y generales de un usuario mediante la utilización de documentos académicos mediante la integración de Modelos Grandes de Lenguaje (LLMs), bases de datos vectorizadas y la técnica Retrieval-Augmented Generation (RAG). Utilizando herramientas como LangChain, Python, y ChromaDB, se implementa una solución modular y contenerizada, capaz de procesar grandes volúmenes de datos y contextualizar respuestas según las consultas de los usuarios. Se destaca la realización de pruebas unitarias y la optimización de recursos para garantizar un funcionamiento eficiente en un entorno on-premise.