Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG
El trabajo de grado desarrolla un sistema web para el Grupo de Automática de la Universidad Nacional(GAUNAL) que permite responder a preguntas específicas y generales de un usuario mediante la utilización de documentos académicos mediante la integración de Modelos Grandes de Lenguaje (LLMs), bases d...
- Autores:
-
Huguet Ospina, Juan José
- Tipo de recurso:
- Fecha de publicación:
- 2024
- Institución:
- Politécnico Colombiano Jaime Izasa Cadavid
- Repositorio:
- ICARUS
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.elpoli.edu.co:123456789/9027
- Acceso en línea:
- https://repositorio.elpoli.edu.co/handle/123456789/9027
- Palabra clave:
- Búsqueda electrónica de recursos de información
Investigación científica
Universidad Nacional de Colombia. Grupo de Automática
Generación aumentada recolectada
LangChain
Python
ChromaDB
- Rights
- License
- http://creativecommons.org/licenses/by-nc/4.0/
id |
ICARUS2_af44270e17dd6880f911191c1f712614 |
---|---|
oai_identifier_str |
oai:repositorio.elpoli.edu.co:123456789/9027 |
network_acronym_str |
ICARUS2 |
network_name_str |
ICARUS |
repository_id_str |
|
dc.title.none.fl_str_mv |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
title |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
spellingShingle |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG Búsqueda electrónica de recursos de información Investigación científica Universidad Nacional de Colombia. Grupo de Automática Generación aumentada recolectada LangChain Python ChromaDB |
title_short |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
title_full |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
title_fullStr |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
title_full_unstemmed |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
title_sort |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
dc.creator.fl_str_mv |
Huguet Ospina, Juan José |
dc.contributor.advisor.none.fl_str_mv |
Espinosa Oviedo, Jorge Ernesto |
dc.contributor.author.none.fl_str_mv |
Huguet Ospina, Juan José |
dc.subject.none.fl_str_mv |
Búsqueda electrónica de recursos de información Investigación científica Universidad Nacional de Colombia. Grupo de Automática Generación aumentada recolectada LangChain Python ChromaDB |
topic |
Búsqueda electrónica de recursos de información Investigación científica Universidad Nacional de Colombia. Grupo de Automática Generación aumentada recolectada LangChain Python ChromaDB |
description |
El trabajo de grado desarrolla un sistema web para el Grupo de Automática de la Universidad Nacional(GAUNAL) que permite responder a preguntas específicas y generales de un usuario mediante la utilización de documentos académicos mediante la integración de Modelos Grandes de Lenguaje (LLMs), bases de datos vectorizadas y la técnica Retrieval-Augmented Generation (RAG). Utilizando herramientas como LangChain, Python, y ChromaDB, se implementa una solución modular y contenerizada, capaz de procesar grandes volúmenes de datos y contextualizar respuestas según las consultas de los usuarios. Se destaca la realización de pruebas unitarias y la optimización de recursos para garantizar un funcionamiento eficiente en un entorno on-premise. |
publishDate |
2024 |
dc.date.issued.none.fl_str_mv |
2024 |
dc.date.accessioned.none.fl_str_mv |
2025-04-25T19:26:40Z |
dc.date.available.none.fl_str_mv |
2025-04-25T19:26:40Z |
dc.type.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.other.none.fl_str_mv |
TIIN1063 |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.elpoli.edu.co/handle/123456789/9027 |
identifier_str_mv |
TIIN1063 |
url |
https://repositorio.elpoli.edu.co/handle/123456789/9027 |
dc.language.iso.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.cc.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
dc.format.none.fl_str_mv |
http://purl.org/coar/resource_type/c_18cf |
dc.publisher.none.fl_str_mv |
Politécnico Colombiano Jaime Isaza Cadavid |
dc.publisher.department.none.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.program.none.fl_str_mv |
Ingenería Informática |
publisher.none.fl_str_mv |
Politécnico Colombiano Jaime Isaza Cadavid |
institution |
Politécnico Colombiano Jaime Izasa Cadavid |
bitstream.url.fl_str_mv |
https://repositorio.elpoli.edu.co/bitstreams/1804b29f-dec4-4951-a92f-5c6893bf4dc1/download https://repositorio.elpoli.edu.co/bitstreams/e2fcc53f-0067-441a-9888-058fc7e982ca/download https://repositorio.elpoli.edu.co/bitstreams/03826895-fa97-4a71-ae32-e0cc8aff960d/download |
bitstream.checksum.fl_str_mv |
472812fcea495215bae6d804b759e7f4 11366b27195a895f0cb5d1c670b7b96c 642f93b35eb56513c4d14578dcf73516 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional POLIJIC |
repository.mail.fl_str_mv |
repositorio.polijic@gmail.com |
_version_ |
1838572285031612416 |
spelling |
Espinosa Oviedo, Jorge ErnestoHuguet Ospina, Juan José2025-04-25T19:26:40Z2025-04-25T19:26:40Z2024El trabajo de grado desarrolla un sistema web para el Grupo de Automática de la Universidad Nacional(GAUNAL) que permite responder a preguntas específicas y generales de un usuario mediante la utilización de documentos académicos mediante la integración de Modelos Grandes de Lenguaje (LLMs), bases de datos vectorizadas y la técnica Retrieval-Augmented Generation (RAG). Utilizando herramientas como LangChain, Python, y ChromaDB, se implementa una solución modular y contenerizada, capaz de procesar grandes volúmenes de datos y contextualizar respuestas según las consultas de los usuarios. Se destaca la realización de pruebas unitarias y la optimización de recursos para garantizar un funcionamiento eficiente en un entorno on-premise.http://purl.org/coar/resource_type/c_18cfTIIN1063https://repositorio.elpoli.edu.co/handle/123456789/9027Politécnico Colombiano Jaime Isaza CadavidFacultad de IngenieríaIngenería Informáticahttp://creativecommons.org/licenses/by-nc/4.0/http://purl.org/coar/access_right/c_abf2Búsqueda electrónica de recursos de informaciónInvestigación científicaUniversidad Nacional de Colombia. Grupo de AutomáticaGeneración aumentada recolectadaLangChainPythonChromaDBDesarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAGhttp://purl.org/redcol/resource_type/TPhttp://purl.org/coar/resource_type/c_7a1fspaORIGINALTIIN1063.pdfTIIN1063.pdfapplication/pdf4493753https://repositorio.elpoli.edu.co/bitstreams/1804b29f-dec4-4951-a92f-5c6893bf4dc1/download472812fcea495215bae6d804b759e7f4MD52AUTORIZACIÓN DE USO.pdfAUTORIZACIÓN DE USO.pdfapplication/pdf126680https://repositorio.elpoli.edu.co/bitstreams/e2fcc53f-0067-441a-9888-058fc7e982ca/download11366b27195a895f0cb5d1c670b7b96cMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-82614https://repositorio.elpoli.edu.co/bitstreams/03826895-fa97-4a71-ae32-e0cc8aff960d/download642f93b35eb56513c4d14578dcf73516MD51123456789/9027oai:repositorio.elpoli.edu.co:123456789/90272025-05-20 09:11:35.39https://repositorio.elpoli.edu.coRepositorio Institucional POLIJICrepositorio.polijic@gmail.comTElDRU5DSUEgREUgUFVCTElDQUNJw5NOIERFIERPQ1VNRU5UTwoKRUwgQVVUT1IsIG1hbmlmaWVzdGEgcXVlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gZXMgb3JpZ2luYWwKeSBsYSByZWFsaXrDsyBzaW4gdmlvbGFyIG8gdXN1cnBhciBkZXJlY2hvcyBkZSBhdXRvciBkZSB0ZXJjZXJvcywgcG9yIGxvIHRhbnRvLApsYSBvYnJhIGVzIGRlIGV4Y2x1c2l2YSBhdXRvcsOtYSB5IHRpZW5lIGxhIHRpdHVsYXJpZGFkIHNvYnJlIGxhIG1pc21hLgoKUEFSw4FHUkFGTzogRW4gY2FzbyBkZSBwcmVzZW50YXJzZSBjdWFscXVpZXIgcmVjbGFtYWNpw7NuIG8gYWNjacOzbiBwb3IgcGFydGUKZGUgdW4gdGVyY2VybyBlbiBjdWFudG8gYSBsb3MgZGVyZWNob3MgZGUgYXV0b3Igc29icmUgbGEgb2JyYSBlbiBjdWVzdGnDs24sCkVMIEFVVE9SLCBhc3VtaXLDoSB0b2RhIGxhIHJlc3BvbnNhYmlsaWRhZCwgeSBzYWxkcsOhIGVuIGRlZmVuc2EgZGUgbG9zIGRlcmVjaG9zCmFxdcOtIGF1dG9yaXphZG9zOyBwYXJhIHRvZG9zIGxvcyBlZmVjdG9zIGxhIHVuaXZlcnNpZGFkIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8KZGUgYnVlbmEgZmUuCgpFTCBBVVRPUiwgYXV0b3JpemEgYWwgUG9saXTDqWNuaWNvIENvbG9tYmlhbm8gSmFpbWUgSXNhemEgQ2FkYXZpZCwgcGFyYSBxdWUKZW4gbG9zIHTDqXJtaW5vcyBlc3RhYmxlY2lkb3MgZW4gbGEgbGV5IDIzIGRlIDE5ODIsIGxleSA0NCBkZSAxOTkzLApkZWNpc2nDs24gQW5kaW5hIDM1MSBkZSAxOTkzLCBEZWNyZXRvIDQ2MCBkZSAxOTk1IHkgZGVtw6FzIG5vcm1hcyBnZW5lcmFsZXMKc29icmUgbGEgbWF0ZXJpYSwgbGEgcHVibGljYWNpw7NuIGRlIGxvcyBtZXRhZGF0b3MgYXF1w60gcmVnaXN0cmFkb3MgcGFyYSBmaW5lcwphY2Fkw6ltaWNvcyBlIGludmVzdGlnYXRpdm9zLiBFbiBmdW5jacOzbiBkZSBsbyBjdWFsLCBhbCBmaXJtYXIgeSBlbnZpYXIgZXN0YSBsaWNlbmNpYSwKRUwgQVVUT1Igb3RvcmdhIGFsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQgZWwgZGVyZWNobyBOTyBFWENMVVNJVk8KZGUgYWxtYWNlbmFyLCByZXByb2R1Y2lyLCB0cmFkdWNpciB5IGRpdnVsZ2FyIGxvcyBtZXRhZGF0b3MgYXF1w60gcmVnaXN0cmFkb3MgZW4gZm9ybWF0bwppbXByZXNvLCBlbGVjdHLDs25pY28geSBlbiBjdWFscXVpZXIgbWVkaW8sIGluY2x1eWVuZG8sIHBlcm8gbm8gbGltaXRhZG8gYSBhdWRpbyBvIHbDrWRlbzsKeSBhY2VwdGEgcXVlIGVsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQgcHVlZGUsIFNJTiBNT0RJRklDQVIKRUwgQ09OVEVOSURPIHkgUkVTUEVUQU5UTyBMT1MgREVSRUNIT1MgTU9SQUxFUywgZGlzcG9uZXIgZGUgbGEgcmVjdXBlcmFjacOzbiBkZSBpbmZvcm1hY2nDs24KcG9yIHBhcnRlIGRlIGNvc2VjaGFkb3JlcyBkZSBpbmZvcm1hY2nDs24gYXZhbGFkb3MgcG9yIGVsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQKeSBxdWUgZXN0b3MgbWV0YWRhdG9zIHNlYW4gcmVjdXBlcmFibGVzIHkgYWNjZXNpYmxlcyBjb24gZmluZXMgYWNhZMOpbWljb3MgZSBpbnZlc3RpZ2F0aXZvcy4KCkxvIGFudGVyaW9yLCBTSU4gUVVFIEVTVE8gQ09OTExFVkUgQSBRVUUgQUwgUG9saXTDqWNuaWNvIENvbG9tYmlhbm8gSmFpbWUgSXNhemEgQ2FkYXZpZApFU1TDiSBPQkxJR0FEQSBBIEJSSU5EQVIgQ09NUEVOU0FTScOTTiBNT05FVEFSSUEgQUwgQVVUT1IgcG9yIGFjdGl2aWRhZGVzIGRlIGRpdnVsZ2FjacOzbgp5IGxvcyBwb3NpYmxlcyBiZW5lZmljaW9zIGVjb27Ds21pY29zIHF1ZSBlc3RhIGRpdnVsZ2FjacOzbiBwdWVkYSBnZW5lcmFyIHBhcmEgZWwKUG9saXTDqWNuaWNvIENvbG9tYmlhbm8gSmFpbWUgSXNhemEgQ2FkYXZpZC4KCi0tLS0tLS0tLS0KUE9Mw41USUNBIERFIFRSQVRBTUlFTlRPIERFIERBVE9TIFBFUlNPTkFMRVMuCkRlY2xhcm8gcXVlIGF1dG9yaXpvIHByZXZpYSB5IGRlIGZvcm1hIGluZm9ybWFkYSBlbCB0cmF0YW1pZW50byBkZSBtaXMgZGF0b3MgcGVyc29uYWxlcwpwb3IgcGFydGUgZGVsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQgcGFyYSBmaW5lcyBhY2Fkw6ltaWNvcyB5IGVuCmFwbGljYWNpw7NuIGRlIGNvbnZlbmlvcyBjb24gdGVyY2Vyb3MgbyBzZXJ2aWNpb3MgY29uZXhvcyBjb24gYWN0aXZpZGFkZXMgcHJvcGlhcyBkZQpsYSBhY2FkZW1pYSwgY29uIGVzdHJpY3RvcyBjdW1wbGltaWVudG9zIGRlIGxvcyBwcmluY2lwaW9zIGRlIGxleSAxNTgxIGRlIDIwMTIuCgpEZSBpZ3VhbCBmb3JtYSBlbiBmdW5jacOzbiBkZWwgY29ycmVjdG8gZWplcmNpY2lvIGRlIG1pIGRlcmVjaG8gZGUgaGFiZWFzIGRhdGEgcHVlZG8KZW4gY3VhbHF1aWVyIG1vbWVudG8sIHByZXZpYSBpZGVudGlmaWNhY2nDs24sIHNvbGljaXRhciBsYSBjb25zdWx0YSwgY29ycmVjY2nDs24geQpzdXByZXNpw7NuIGRlIG1pcyBkYXRvcyBwb3IgbWVkaW8gZGUgY29tdW5pY2FjacOzbiBvZmljaWFsIGRpcmlnaWRhIGFsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQuCg== |