Integración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes

El potencial de los Modelos de Lenguaje de Gran Tamaño (LLMs como GPT- 4o, Claude, Gemini, Llama, etc.) se ve amenazado por los problemas al obtener respuestas incorrectas o por fuera de un contexto de conocimiento esperado. Técnicas como Retrieval-Augmented Generation (RAG) han surgido como solucio...

Full description

Autores:
Guerrero Sarmiento, Andrés Felipe
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2025
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/75888
Acceso en línea:
https://hdl.handle.net/1992/75888
Palabra clave:
Modelos de Lenguaje de Gran Tamaño (LLMs)
Asistentes Inteligentes
Inteligencia Artificial
Procesamiento del Lenguaje Natural (NLP)
Educación
Retrieval-Augmented Generation (RAG)
Semantic Chunking
Statistical Chunking
Ingeniería
Rights
openAccess
License
Attribution 4.0 International
id UNIANDES2_8ff5c1ba72112c7f93d3fc1df7638a77
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/75888
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.spa.fl_str_mv Integración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes
title Integración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes
spellingShingle Integración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes
Modelos de Lenguaje de Gran Tamaño (LLMs)
Asistentes Inteligentes
Inteligencia Artificial
Procesamiento del Lenguaje Natural (NLP)
Educación
Retrieval-Augmented Generation (RAG)
Semantic Chunking
Statistical Chunking
Ingeniería
title_short Integración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes
title_full Integración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes
title_fullStr Integración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes
title_full_unstemmed Integración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes
title_sort Integración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes
dc.creator.fl_str_mv Guerrero Sarmiento, Andrés Felipe
dc.contributor.advisor.none.fl_str_mv Casallas Gutiérrez, Rubby
dc.contributor.author.none.fl_str_mv Guerrero Sarmiento, Andrés Felipe
dc.contributor.jury.none.fl_str_mv Casallas Gutiérrez, Rubby
dc.subject.keyword.spa.fl_str_mv Modelos de Lenguaje de Gran Tamaño (LLMs)
Asistentes Inteligentes
Inteligencia Artificial
Procesamiento del Lenguaje Natural (NLP)
Educación
topic Modelos de Lenguaje de Gran Tamaño (LLMs)
Asistentes Inteligentes
Inteligencia Artificial
Procesamiento del Lenguaje Natural (NLP)
Educación
Retrieval-Augmented Generation (RAG)
Semantic Chunking
Statistical Chunking
Ingeniería
dc.subject.keyword.eng.fl_str_mv Retrieval-Augmented Generation (RAG)
Semantic Chunking
Statistical Chunking
dc.subject.themes.none.fl_str_mv Ingeniería
description El potencial de los Modelos de Lenguaje de Gran Tamaño (LLMs como GPT- 4o, Claude, Gemini, Llama, etc.) se ve amenazado por los problemas al obtener respuestas incorrectas o por fuera de un contexto de conocimiento esperado. Técnicas como Retrieval-Augmented Generation (RAG) han surgido como soluciones prometedoras al potenciar los LLMs, con fuentes de conocimiento externo, para mejorar la precisión y relevancia contextual. Este proyecto investiga la aplicación de RAG en el desarrollo de asistentes inteligentes dentro de una herramienta open source. Se exploran varias técnicas de fragmentación del conocimiento y se realizan casos de estudio donde se evidencia las mejoras en la precisión de las respuestas de los modelos utilizando la fragmentación semántica.
publishDate 2025
dc.date.accessioned.none.fl_str_mv 2025-01-31T13:07:49Z
dc.date.available.none.fl_str_mv 2025-01-31T13:07:49Z
dc.date.issued.none.fl_str_mv 2025-01-30
dc.type.none.fl_str_mv Trabajo de grado - Pregrado
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.none.fl_str_mv Text
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/1992/75888
dc.identifier.instname.none.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.none.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.none.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url https://hdl.handle.net/1992/75888
identifier_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.en.fl_str_mv Attribution 4.0 International
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by/4.0/
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Attribution 4.0 International
http://creativecommons.org/licenses/by/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.none.fl_str_mv 43 páginas
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de los Andes
dc.publisher.program.none.fl_str_mv Ingeniería de Sistemas y Computación
dc.publisher.faculty.none.fl_str_mv Facultad de Ingeniería
dc.publisher.department.none.fl_str_mv Departamento de Ingeniería de Sistemas y Computación
publisher.none.fl_str_mv Universidad de los Andes
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/b96eca78-a6eb-46ef-93b3-05c5d567409a/download
https://repositorio.uniandes.edu.co/bitstreams/dfe9c058-9aa9-483e-add3-9293a6f6f453/download
https://repositorio.uniandes.edu.co/bitstreams/188cddd2-81dc-4f3e-bb9d-9451df40175c/download
https://repositorio.uniandes.edu.co/bitstreams/edec5e10-3303-4847-9e77-3feedacf5ce1/download
https://repositorio.uniandes.edu.co/bitstreams/9f533212-9c81-4e43-9e65-f35767cdde2e/download
https://repositorio.uniandes.edu.co/bitstreams/5dddd65f-5b75-44f8-a68f-602f4b8d3921/download
https://repositorio.uniandes.edu.co/bitstreams/26521cb1-33a9-429e-b8f6-76da56a39ad5/download
https://repositorio.uniandes.edu.co/bitstreams/2a35f836-d8cc-4e05-8fff-216afd2a98da/download
bitstream.checksum.fl_str_mv ee90fe0a9faefbcd9d9ecd9296cef84a
8e83c22401028ba8fd6d2af23d453e80
0175ea4a2d4caec4bbcc37e300941108
ae9e573a68e7f92501b6913cc846c39f
37663cfffed7ba0ac79f871ba7e68265
4356a3ec5f3ed8368559c32e7aced6cd
e2aedbd98e3dc6538e0ba1fd240d4890
7507d60b356b839ddaa507568b1c96b7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1831927710184636416
spelling Casallas Gutiérrez, Rubbyvirtual::22959-1Guerrero Sarmiento, Andrés FelipeCasallas Gutiérrez, Rubby2025-01-31T13:07:49Z2025-01-31T13:07:49Z2025-01-30https://hdl.handle.net/1992/75888instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/El potencial de los Modelos de Lenguaje de Gran Tamaño (LLMs como GPT- 4o, Claude, Gemini, Llama, etc.) se ve amenazado por los problemas al obtener respuestas incorrectas o por fuera de un contexto de conocimiento esperado. Técnicas como Retrieval-Augmented Generation (RAG) han surgido como soluciones prometedoras al potenciar los LLMs, con fuentes de conocimiento externo, para mejorar la precisión y relevancia contextual. Este proyecto investiga la aplicación de RAG en el desarrollo de asistentes inteligentes dentro de una herramienta open source. Se exploran varias técnicas de fragmentación del conocimiento y se realizan casos de estudio donde se evidencia las mejoras en la precisión de las respuestas de los modelos utilizando la fragmentación semántica.Pregrado43 páginasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y ComputaciónAttribution 4.0 Internationalhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Integración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los AndesTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPModelos de Lenguaje de Gran Tamaño (LLMs)Asistentes InteligentesInteligencia ArtificialProcesamiento del Lenguaje Natural (NLP)EducaciónRetrieval-Augmented Generation (RAG)Semantic ChunkingStatistical ChunkingIngeniería202015143Publicationhttps://scholar.google.es/citations?user=WVzxlbUAAAAJvirtual::22959-10000-0002-8857-3609virtual::22959-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000143049virtual::22959-12f1ccb4d-a3d1-4b1e-822e-643394f0803avirtual::22959-12f1ccb4d-a3d1-4b1e-822e-643394f0803avirtual::22959-1ORIGINALIntegración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes.pdfIntegración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes.pdfEl potencial de los Modelos de Lenguaje de Gran Tamaño (LLMs como GPT- 4o, Claude, Gemini, Llama, etc.) se ve amenazado por los problemas al obtener respuestas incorrectas o por fuera de un contexto de conocimiento esperado. Técnicas como Retrieval-Augmented Generation (RAG) han surgido como soluciones prometedoras al potenciar los LLMs, con fuentes de conocimiento externo, para mejorar la precisión y relevancia contextual. Este proyecto investiga la aplicación de RAG en el desarrollo de asistentes inteligentes dentro de una herramienta open source. Se exploran varias técnicas de fragmentación del conocimiento y se realizan casos de estudio donde se evidencia las mejoras en la precisión de las respuestas de los modelos utilizando la fragmentación semántica.application/pdf2110071https://repositorio.uniandes.edu.co/bitstreams/b96eca78-a6eb-46ef-93b3-05c5d567409a/downloadee90fe0a9faefbcd9d9ecd9296cef84aMD51autorizacion tesis Final_firmado.pdfautorizacion tesis Final_firmado.pdfHIDEapplication/pdf326285https://repositorio.uniandes.edu.co/bitstreams/dfe9c058-9aa9-483e-add3-9293a6f6f453/download8e83c22401028ba8fd6d2af23d453e80MD54CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8908https://repositorio.uniandes.edu.co/bitstreams/188cddd2-81dc-4f3e-bb9d-9451df40175c/download0175ea4a2d4caec4bbcc37e300941108MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82535https://repositorio.uniandes.edu.co/bitstreams/edec5e10-3303-4847-9e77-3feedacf5ce1/downloadae9e573a68e7f92501b6913cc846c39fMD53TEXTIntegración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes.pdf.txtIntegración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes.pdf.txtExtracted texttext/plain82113https://repositorio.uniandes.edu.co/bitstreams/9f533212-9c81-4e43-9e65-f35767cdde2e/download37663cfffed7ba0ac79f871ba7e68265MD55autorizacion tesis Final_firmado.pdf.txtautorizacion tesis Final_firmado.pdf.txtExtracted texttext/plain2109https://repositorio.uniandes.edu.co/bitstreams/5dddd65f-5b75-44f8-a68f-602f4b8d3921/download4356a3ec5f3ed8368559c32e7aced6cdMD57THUMBNAILIntegración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes.pdf.jpgIntegración de RAG en asistentes inteligentes para mejorar los procesos de enseñanza y aprendizaje en la Universidad de los Andes.pdf.jpgGenerated Thumbnailimage/jpeg9648https://repositorio.uniandes.edu.co/bitstreams/26521cb1-33a9-429e-b8f6-76da56a39ad5/downloade2aedbd98e3dc6538e0ba1fd240d4890MD56autorizacion tesis Final_firmado.pdf.jpgautorizacion tesis Final_firmado.pdf.jpgGenerated Thumbnailimage/jpeg10995https://repositorio.uniandes.edu.co/bitstreams/2a35f836-d8cc-4e05-8fff-216afd2a98da/download7507d60b356b839ddaa507568b1c96b7MD581992/75888oai:repositorio.uniandes.edu.co:1992/758882025-03-05 10:02:22.457http://creativecommons.org/licenses/by/4.0/Attribution 4.0 Internationalopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coPGgzPjxzdHJvbmc+RGVzY2FyZ28gZGUgUmVzcG9uc2FiaWxpZGFkIC0gTGljZW5jaWEgZGUgQXV0b3JpemFjacOzbjwvc3Ryb25nPjwvaDM+CjxwPjxzdHJvbmc+UG9yIGZhdm9yIGxlZXIgYXRlbnRhbWVudGUgZXN0ZSBkb2N1bWVudG8gcXVlIHBlcm1pdGUgYWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCBTw6luZWNhIHJlcHJvZHVjaXIgeSBkaXN0cmlidWlyIGxvcyByZWN1cnNvcyBkZSBpbmZvcm1hY2nDs24gZGVwb3NpdGFkb3MgbWVkaWFudGUgbGEgYXV0b3JpemFjacOzbiBkZSBsb3Mgc2lndWllbnRlcyB0w6lybWlub3M6PC9zdHJvbmc+PC9wPgo8cD5Db25jZWRhIGxhIGxpY2VuY2lhIGRlIGRlcMOzc2l0byBlc3TDoW5kYXIgc2VsZWNjaW9uYW5kbyBsYSBvcGNpw7NuIDxzdHJvbmc+J0FjZXB0YXIgbG9zIHTDqXJtaW5vcyBhbnRlcmlvcm1lbnRlIGRlc2NyaXRvcyc8L3N0cm9uZz4geSBjb250aW51YXIgZWwgcHJvY2VzbyBkZSBlbnbDrW8gbWVkaWFudGUgZWwgYm90w7NuIDxzdHJvbmc+J1NpZ3VpZW50ZScuPC9zdHJvbmc+PC9wPgo8aHI+CjxwPllvLCBlbiBtaSBjYWxpZGFkIGRlIGF1dG9yIGRlbCB0cmFiYWpvIGRlIHRlc2lzLCBtb25vZ3JhZsOtYSBvIHRyYWJham8gZGUgZ3JhZG8sIGhhZ28gZW50cmVnYSBkZWwgZWplbXBsYXIgcmVzcGVjdGl2byB5IGRlIHN1cyBhbmV4b3MgZGUgc2VyIGVsIGNhc28sIGVuIGZvcm1hdG8gZGlnaXRhbCB5L28gZWxlY3Ryw7NuaWNvIHkgYXV0b3Jpem8gYSBsYSBVbml2ZXJzaWRhZCBkZSBsb3MgQW5kZXMgcGFyYSBxdWUgcmVhbGljZSBsYSBwdWJsaWNhY2nDs24gZW4gZWwgU2lzdGVtYSBkZSBCaWJsaW90ZWNhcyBvIGVuIGN1YWxxdWllciBvdHJvIHNpc3RlbWEgbyBiYXNlIGRlIGRhdG9zIHByb3BpbyBvIGFqZW5vIGEgbGEgVW5pdmVyc2lkYWQgeSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMsIERlY3JldG8gNDYwIGRlIDE5OTUgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGVuIHRvZGFzIHN1cyBmb3JtYXMsIGxvcyBkZXJlY2hvcyBwYXRyaW1vbmlhbGVzIGRlIHJlcHJvZHVjY2nDs24sIGNvbXVuaWNhY2nDs24gcMO6YmxpY2EsIHRyYW5zZm9ybWFjacOzbiB5IGRpc3RyaWJ1Y2nDs24gKGFscXVpbGVyLCBwcsOpc3RhbW8gcMO6YmxpY28gZSBpbXBvcnRhY2nDs24pIHF1ZSBtZSBjb3JyZXNwb25kZW4gY29tbyBjcmVhZG9yIGRlIGxhIG9icmEgb2JqZXRvIGRlbCBwcmVzZW50ZSBkb2N1bWVudG8uPC9wPgo8cD5MYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGVtaXRlIGVuIGNhbGlkYWQgZGUgYXV0b3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50byB5IG5vIGNvcnJlc3BvbmRlIGEgY2VzacOzbiBkZSBkZXJlY2hvcywgc2lubyBhIGxhIGF1dG9yaXphY2nDs24gZGUgdXNvIGFjYWTDqW1pY28gZGUgY29uZm9ybWlkYWQgY29uIGxvIGFudGVyaW9ybWVudGUgc2XDsWFsYWRvLiBMYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGhhY2UgZXh0ZW5zaXZhIG5vIHNvbG8gYSBsYXMgZmFjdWx0YWRlcyB5IGRlcmVjaG9zIGRlIHVzbyBzb2JyZSBsYSBvYnJhIGVuIGZvcm1hdG8gbyBzb3BvcnRlIG1hdGVyaWFsLCBzaW5vIHRhbWJpw6luIHBhcmEgZm9ybWF0byBlbGVjdHLDs25pY28sIHkgZW4gZ2VuZXJhbCBwYXJhIGN1YWxxdWllciBmb3JtYXRvIGNvbm9jaWRvIG8gcG9yIGNvbm9jZXIuPC9wPgo8cD5FbCBhdXRvciwgbWFuaWZpZXN0YSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgc3UgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuPC9wPgo8cD5FbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLjwvcD4KPHA+U2kgdGllbmUgYWxndW5hIGR1ZGEgc29icmUgbGEgbGljZW5jaWEsIHBvciBmYXZvciwgY29udGFjdGUgY29uIGVsIDxhIGhyZWY9Im1haWx0bzpiaWJsaW90ZWNhQHVuaWFuZGVzLmVkdS5jbyIgdGFyZ2V0PSJfYmxhbmsiPkFkbWluaXN0cmFkb3IgZGVsIFNpc3RlbWEuPC9hPjwvcD4K