Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG

El trabajo de grado desarrolla un sistema web para el Grupo de Automática de la Universidad Nacional(GAUNAL) que permite responder a preguntas específicas y generales de un usuario mediante la utilización de documentos académicos mediante la integración de Modelos Grandes de Lenguaje (LLMs), bases d...

Full description

Autores:
Huguet Ospina, Juan José
Tipo de recurso:
Fecha de publicación:
2024
Institución:
Politécnico Colombiano Jaime Izasa Cadavid
Repositorio:
ICARUS
Idioma:
spa
OAI Identifier:
oai:repositorio.elpoli.edu.co:123456789/9027
Acceso en línea:
https://repositorio.elpoli.edu.co/handle/123456789/9027
Palabra clave:
Búsqueda electrónica de recursos de información
Investigación científica
Universidad Nacional de Colombia. Grupo de Automática
Generación aumentada recolectada
LangChain
Python
ChromaDB
Rights
License
http://creativecommons.org/licenses/by-nc/4.0/
id ICARUS2_af44270e17dd6880f911191c1f712614
oai_identifier_str oai:repositorio.elpoli.edu.co:123456789/9027
network_acronym_str ICARUS2
network_name_str ICARUS
repository_id_str
dc.title.none.fl_str_mv Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG
title Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG
spellingShingle Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG
Búsqueda electrónica de recursos de información
Investigación científica
Universidad Nacional de Colombia. Grupo de Automática
Generación aumentada recolectada
LangChain
Python
ChromaDB
title_short Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG
title_full Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG
title_fullStr Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG
title_full_unstemmed Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG
title_sort Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG
dc.creator.fl_str_mv Huguet Ospina, Juan José
dc.contributor.advisor.none.fl_str_mv Espinosa Oviedo, Jorge Ernesto
dc.contributor.author.none.fl_str_mv Huguet Ospina, Juan José
dc.subject.none.fl_str_mv Búsqueda electrónica de recursos de información
Investigación científica
Universidad Nacional de Colombia. Grupo de Automática
Generación aumentada recolectada
LangChain
Python
ChromaDB
topic Búsqueda electrónica de recursos de información
Investigación científica
Universidad Nacional de Colombia. Grupo de Automática
Generación aumentada recolectada
LangChain
Python
ChromaDB
description El trabajo de grado desarrolla un sistema web para el Grupo de Automática de la Universidad Nacional(GAUNAL) que permite responder a preguntas específicas y generales de un usuario mediante la utilización de documentos académicos mediante la integración de Modelos Grandes de Lenguaje (LLMs), bases de datos vectorizadas y la técnica Retrieval-Augmented Generation (RAG). Utilizando herramientas como LangChain, Python, y ChromaDB, se implementa una solución modular y contenerizada, capaz de procesar grandes volúmenes de datos y contextualizar respuestas según las consultas de los usuarios. Se destaca la realización de pruebas unitarias y la optimización de recursos para garantizar un funcionamiento eficiente en un entorno on-premise.
publishDate 2024
dc.date.issued.none.fl_str_mv 2024
dc.date.accessioned.none.fl_str_mv 2025-04-25T19:26:40Z
dc.date.available.none.fl_str_mv 2025-04-25T19:26:40Z
dc.type.none.fl_str_mv http://purl.org/redcol/resource_type/TP
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.identifier.other.none.fl_str_mv TIIN1063
dc.identifier.uri.none.fl_str_mv https://repositorio.elpoli.edu.co/handle/123456789/9027
identifier_str_mv TIIN1063
url https://repositorio.elpoli.edu.co/handle/123456789/9027
dc.language.iso.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.cc.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
dc.format.none.fl_str_mv http://purl.org/coar/resource_type/c_18cf
dc.publisher.none.fl_str_mv Politécnico Colombiano Jaime Isaza Cadavid
dc.publisher.department.none.fl_str_mv Facultad de Ingeniería
dc.publisher.program.none.fl_str_mv Ingenería Informática
publisher.none.fl_str_mv Politécnico Colombiano Jaime Isaza Cadavid
institution Politécnico Colombiano Jaime Izasa Cadavid
bitstream.url.fl_str_mv https://repositorio.elpoli.edu.co/bitstreams/1804b29f-dec4-4951-a92f-5c6893bf4dc1/download
https://repositorio.elpoli.edu.co/bitstreams/e2fcc53f-0067-441a-9888-058fc7e982ca/download
https://repositorio.elpoli.edu.co/bitstreams/03826895-fa97-4a71-ae32-e0cc8aff960d/download
bitstream.checksum.fl_str_mv 472812fcea495215bae6d804b759e7f4
11366b27195a895f0cb5d1c670b7b96c
642f93b35eb56513c4d14578dcf73516
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional POLIJIC
repository.mail.fl_str_mv repositorio.polijic@gmail.com
_version_ 1838572285031612416
spelling Espinosa Oviedo, Jorge ErnestoHuguet Ospina, Juan José2025-04-25T19:26:40Z2025-04-25T19:26:40Z2024El trabajo de grado desarrolla un sistema web para el Grupo de Automática de la Universidad Nacional(GAUNAL) que permite responder a preguntas específicas y generales de un usuario mediante la utilización de documentos académicos mediante la integración de Modelos Grandes de Lenguaje (LLMs), bases de datos vectorizadas y la técnica Retrieval-Augmented Generation (RAG). Utilizando herramientas como LangChain, Python, y ChromaDB, se implementa una solución modular y contenerizada, capaz de procesar grandes volúmenes de datos y contextualizar respuestas según las consultas de los usuarios. Se destaca la realización de pruebas unitarias y la optimización de recursos para garantizar un funcionamiento eficiente en un entorno on-premise.http://purl.org/coar/resource_type/c_18cfTIIN1063https://repositorio.elpoli.edu.co/handle/123456789/9027Politécnico Colombiano Jaime Isaza CadavidFacultad de IngenieríaIngenería Informáticahttp://creativecommons.org/licenses/by-nc/4.0/http://purl.org/coar/access_right/c_abf2Búsqueda electrónica de recursos de informaciónInvestigación científicaUniversidad Nacional de Colombia. Grupo de AutomáticaGeneración aumentada recolectadaLangChainPythonChromaDBDesarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAGhttp://purl.org/redcol/resource_type/TPhttp://purl.org/coar/resource_type/c_7a1fspaORIGINALTIIN1063.pdfTIIN1063.pdfapplication/pdf4493753https://repositorio.elpoli.edu.co/bitstreams/1804b29f-dec4-4951-a92f-5c6893bf4dc1/download472812fcea495215bae6d804b759e7f4MD52AUTORIZACIÓN DE USO.pdfAUTORIZACIÓN DE USO.pdfapplication/pdf126680https://repositorio.elpoli.edu.co/bitstreams/e2fcc53f-0067-441a-9888-058fc7e982ca/download11366b27195a895f0cb5d1c670b7b96cMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-82614https://repositorio.elpoli.edu.co/bitstreams/03826895-fa97-4a71-ae32-e0cc8aff960d/download642f93b35eb56513c4d14578dcf73516MD51123456789/9027oai:repositorio.elpoli.edu.co:123456789/90272025-05-20 09:11:35.39https://repositorio.elpoli.edu.coRepositorio Institucional POLIJICrepositorio.polijic@gmail.comTElDRU5DSUEgREUgUFVCTElDQUNJw5NOIERFIERPQ1VNRU5UTwoKRUwgQVVUT1IsIG1hbmlmaWVzdGEgcXVlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gZXMgb3JpZ2luYWwKeSBsYSByZWFsaXrDsyBzaW4gdmlvbGFyIG8gdXN1cnBhciBkZXJlY2hvcyBkZSBhdXRvciBkZSB0ZXJjZXJvcywgcG9yIGxvIHRhbnRvLApsYSBvYnJhIGVzIGRlIGV4Y2x1c2l2YSBhdXRvcsOtYSB5IHRpZW5lIGxhIHRpdHVsYXJpZGFkIHNvYnJlIGxhIG1pc21hLgoKUEFSw4FHUkFGTzogRW4gY2FzbyBkZSBwcmVzZW50YXJzZSBjdWFscXVpZXIgcmVjbGFtYWNpw7NuIG8gYWNjacOzbiBwb3IgcGFydGUKZGUgdW4gdGVyY2VybyBlbiBjdWFudG8gYSBsb3MgZGVyZWNob3MgZGUgYXV0b3Igc29icmUgbGEgb2JyYSBlbiBjdWVzdGnDs24sCkVMIEFVVE9SLCBhc3VtaXLDoSB0b2RhIGxhIHJlc3BvbnNhYmlsaWRhZCwgeSBzYWxkcsOhIGVuIGRlZmVuc2EgZGUgbG9zIGRlcmVjaG9zCmFxdcOtIGF1dG9yaXphZG9zOyBwYXJhIHRvZG9zIGxvcyBlZmVjdG9zIGxhIHVuaXZlcnNpZGFkIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8KZGUgYnVlbmEgZmUuCgpFTCBBVVRPUiwgYXV0b3JpemEgYWwgUG9saXTDqWNuaWNvIENvbG9tYmlhbm8gSmFpbWUgSXNhemEgQ2FkYXZpZCwgcGFyYSBxdWUKZW4gbG9zIHTDqXJtaW5vcyBlc3RhYmxlY2lkb3MgZW4gbGEgbGV5IDIzIGRlIDE5ODIsIGxleSA0NCBkZSAxOTkzLApkZWNpc2nDs24gQW5kaW5hIDM1MSBkZSAxOTkzLCBEZWNyZXRvIDQ2MCBkZSAxOTk1IHkgZGVtw6FzIG5vcm1hcyBnZW5lcmFsZXMKc29icmUgbGEgbWF0ZXJpYSwgbGEgcHVibGljYWNpw7NuIGRlIGxvcyBtZXRhZGF0b3MgYXF1w60gcmVnaXN0cmFkb3MgcGFyYSBmaW5lcwphY2Fkw6ltaWNvcyBlIGludmVzdGlnYXRpdm9zLiBFbiBmdW5jacOzbiBkZSBsbyBjdWFsLCBhbCBmaXJtYXIgeSBlbnZpYXIgZXN0YSBsaWNlbmNpYSwKRUwgQVVUT1Igb3RvcmdhIGFsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQgZWwgZGVyZWNobyBOTyBFWENMVVNJVk8KZGUgYWxtYWNlbmFyLCByZXByb2R1Y2lyLCB0cmFkdWNpciB5IGRpdnVsZ2FyIGxvcyBtZXRhZGF0b3MgYXF1w60gcmVnaXN0cmFkb3MgZW4gZm9ybWF0bwppbXByZXNvLCBlbGVjdHLDs25pY28geSBlbiBjdWFscXVpZXIgbWVkaW8sIGluY2x1eWVuZG8sIHBlcm8gbm8gbGltaXRhZG8gYSBhdWRpbyBvIHbDrWRlbzsKeSBhY2VwdGEgcXVlIGVsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQgcHVlZGUsIFNJTiBNT0RJRklDQVIKRUwgQ09OVEVOSURPIHkgUkVTUEVUQU5UTyBMT1MgREVSRUNIT1MgTU9SQUxFUywgZGlzcG9uZXIgZGUgbGEgcmVjdXBlcmFjacOzbiBkZSBpbmZvcm1hY2nDs24KcG9yIHBhcnRlIGRlIGNvc2VjaGFkb3JlcyBkZSBpbmZvcm1hY2nDs24gYXZhbGFkb3MgcG9yIGVsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQKeSBxdWUgZXN0b3MgbWV0YWRhdG9zIHNlYW4gcmVjdXBlcmFibGVzIHkgYWNjZXNpYmxlcyBjb24gZmluZXMgYWNhZMOpbWljb3MgZSBpbnZlc3RpZ2F0aXZvcy4KCkxvIGFudGVyaW9yLCBTSU4gUVVFIEVTVE8gQ09OTExFVkUgQSBRVUUgQUwgUG9saXTDqWNuaWNvIENvbG9tYmlhbm8gSmFpbWUgSXNhemEgQ2FkYXZpZApFU1TDiSBPQkxJR0FEQSBBIEJSSU5EQVIgQ09NUEVOU0FTScOTTiBNT05FVEFSSUEgQUwgQVVUT1IgcG9yIGFjdGl2aWRhZGVzIGRlIGRpdnVsZ2FjacOzbgp5IGxvcyBwb3NpYmxlcyBiZW5lZmljaW9zIGVjb27Ds21pY29zIHF1ZSBlc3RhIGRpdnVsZ2FjacOzbiBwdWVkYSBnZW5lcmFyIHBhcmEgZWwKUG9saXTDqWNuaWNvIENvbG9tYmlhbm8gSmFpbWUgSXNhemEgQ2FkYXZpZC4KCi0tLS0tLS0tLS0KUE9Mw41USUNBIERFIFRSQVRBTUlFTlRPIERFIERBVE9TIFBFUlNPTkFMRVMuCkRlY2xhcm8gcXVlIGF1dG9yaXpvIHByZXZpYSB5IGRlIGZvcm1hIGluZm9ybWFkYSBlbCB0cmF0YW1pZW50byBkZSBtaXMgZGF0b3MgcGVyc29uYWxlcwpwb3IgcGFydGUgZGVsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQgcGFyYSBmaW5lcyBhY2Fkw6ltaWNvcyB5IGVuCmFwbGljYWNpw7NuIGRlIGNvbnZlbmlvcyBjb24gdGVyY2Vyb3MgbyBzZXJ2aWNpb3MgY29uZXhvcyBjb24gYWN0aXZpZGFkZXMgcHJvcGlhcyBkZQpsYSBhY2FkZW1pYSwgY29uIGVzdHJpY3RvcyBjdW1wbGltaWVudG9zIGRlIGxvcyBwcmluY2lwaW9zIGRlIGxleSAxNTgxIGRlIDIwMTIuCgpEZSBpZ3VhbCBmb3JtYSBlbiBmdW5jacOzbiBkZWwgY29ycmVjdG8gZWplcmNpY2lvIGRlIG1pIGRlcmVjaG8gZGUgaGFiZWFzIGRhdGEgcHVlZG8KZW4gY3VhbHF1aWVyIG1vbWVudG8sIHByZXZpYSBpZGVudGlmaWNhY2nDs24sIHNvbGljaXRhciBsYSBjb25zdWx0YSwgY29ycmVjY2nDs24geQpzdXByZXNpw7NuIGRlIG1pcyBkYXRvcyBwb3IgbWVkaW8gZGUgY29tdW5pY2FjacOzbiBvZmljaWFsIGRpcmlnaWRhIGFsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQuCg==