Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos

El objetivo de este trabajo es mostrar la efectividad alcanzada por dos agentes de aprendizaje por refuerzo cuando se entrenan al tiempo en un ambiente compartido, tomando como dominio la competencia de autos en una pista parcialmente observable. Se definió un comportamiento satisfactorio y un compo...

Full description

Autores:: Daza, Eduardo

Tipo de recurso:: https://vocabularies.coar-repositories.org/resource_types/c_7a1f/

Fecha de publicación:: 2001

Institución:: Universidad del Magdalena

Repositorio:: Repositorio Unimagdalena

Idioma:: spa

id	UNIMAGDALE_94a358e8cb92df3b7dd043fd5be1386d
oai_identifier_str	oai:repositorio.unimagdalena.edu.co:123456789/2406
network_acronym_str	UNIMAGDALE
network_name_str	Repositorio Unimagdalena
repository_id_str
spelling	Prieto, SamuelDaza, EduardoIngeniero (a) de Sistemas2019-05-14T20:55:05Z2019-05-14T20:55:05Z2001200125652http://repositorio.unimagdalena.edu.co/handle/123456789/2406El objetivo de este trabajo es mostrar la efectividad alcanzada por dos agentes de aprendizaje por refuerzo cuando se entrenan al tiempo en un ambiente compartido, tomando como dominio la competencia de autos en una pista parcialmente observable. Se definió un comportamiento satisfactorio y un comportamiento óptimo para evaluar el desempeño de los agentes. Usando lenguaje C++, fue desarrollado para plataforma Linux, el software Pcc, el cual simula las competencias en una pista virtual de carreras y entrega de manera gráfica los resultados del aprendizaje. Se usó el algoritmo SARSA(lambda) con selección de acciones E-greedy en ambos agentes y se corrió la aplicación en ocho escenarios de prueba. Los resultados mostraron el alcance de un comportamiento óptimo en todos los escenarios para ambos agentes. El ambiente discreto, estocástico y parcialmente observable empleado y la co-evolución competitiva lograda y la herramienta de software libre producida, hacen de este trabajo una importante contribución al las investigaciones en aprendizaje de máquina.textUniversidad del MagdalenaFacultad de IngenieríaIngeniería de SistemasSanta MartaRestringidoinfo:eu-repo/semantics/restrictedAccessRestringidoinfo:eu-repo/semantics/restrictedAccesshttps://creativecommons.org/licenses/by-nc-nd/4.0/atribucionnocomercialsinderivarhttp://purl.org/coar/access_right/c_16ecIS-00001Reinforcement learningMulti-Agent SystemsCo-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autosbachelorThesishttps://vocabularies.coar-repositories.org/resource_types/c_7a1f/http://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisTrabajo de Grado de PregradospaPregradoORIGINALIS-00001.pdfIS-00001.pdfapplication/pdf21690105http://localhost:4000/bitstreams/4ec5c7e7-37e4-4eb4-9e33-3750f704c94f/download0b5e0dedab74927c9f05613f7d8a7b2cMD51trueAdministratorREAD2080-12-31LICENSElicense.txtlicense.txttext/plain; charset=utf-82289http://localhost:4000/bitstreams/e7ead366-394e-4a66-88e2-e435c2c915b2/downloadb37f3126bcd22eeae85cbc2659ee387bMD52falseAnonymousREADTEXTIS-00001.pdf.txtIS-00001.pdf.txtExtracted texttext/plain79005http://localhost:4000/bitstreams/f94c4f90-b00a-4e4a-a5f6-7c783a34b309/download2244a3dd1f6c27208a66f086dab0376dMD53falseAnonymousREAD123456789/2406oai:localhost:123456789/24062024-11-22 21:17:54.184restrictedhttp://localhost:4000DSpace Started with Docker Composedspace-help@myu.edu
dc.title.spa.fl_str_mv	Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos
title	Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos
spellingShingle	Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos IS-00001 Reinforcement learning Multi-Agent Systems
title_short	Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos
title_full	Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos
title_fullStr	Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos
title_full_unstemmed	Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos
title_sort	Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos
dc.creator.fl_str_mv	Daza, Eduardo
dc.contributor.advisor.none.fl_str_mv	Prieto, Samuel
dc.contributor.author.none.fl_str_mv	Daza, Eduardo
dc.subject.classification.spa.fl_str_mv	IS-00001
topic	IS-00001 Reinforcement learning Multi-Agent Systems
dc.subject.proposal.spa.fl_str_mv	Reinforcement learning Multi-Agent Systems
description	El objetivo de este trabajo es mostrar la efectividad alcanzada por dos agentes de aprendizaje por refuerzo cuando se entrenan al tiempo en un ambiente compartido, tomando como dominio la competencia de autos en una pista parcialmente observable. Se definió un comportamiento satisfactorio y un comportamiento óptimo para evaluar el desempeño de los agentes. Usando lenguaje C++, fue desarrollado para plataforma Linux, el software Pcc, el cual simula las competencias en una pista virtual de carreras y entrega de manera gráfica los resultados del aprendizaje. Se usó el algoritmo SARSA(lambda) con selección de acciones E-greedy en ambos agentes y se corrió la aplicación en ocho escenarios de prueba. Los resultados mostraron el alcance de un comportamiento óptimo en todos los escenarios para ambos agentes. El ambiente discreto, estocástico y parcialmente observable empleado y la co-evolución competitiva lograda y la herramienta de software libre producida, hacen de este trabajo una importante contribución al las investigaciones en aprendizaje de máquina.
publishDate	2001
dc.date.issued.none.fl_str_mv	2001
dc.date.submitted.none.fl_str_mv	2001
dc.date.accessioned.none.fl_str_mv	2019-05-14T20:55:05Z
dc.date.available.none.fl_str_mv	2019-05-14T20:55:05Z
dc.type.spa.fl_str_mv	bachelorThesis
dc.type.coar.fl_str_mv	http://purl.org/coar/resource_type/c_7a1f
dc.type.coar.none.fl_str_mv	https://vocabularies.coar-repositories.org/resource_types/c_7a1f/
dc.type.driver.none.fl_str_mv	info:eu-repo/semantics/bachelorThesis
dc.type.local.spa.fl_str_mv	Trabajo de Grado de Pregrado
format	https://vocabularies.coar-repositories.org/resource_types/c_7a1f/
dc.identifier.other.none.fl_str_mv	25652
dc.identifier.uri.none.fl_str_mv	http://repositorio.unimagdalena.edu.co/handle/123456789/2406
identifier_str_mv	25652
url	http://repositorio.unimagdalena.edu.co/handle/123456789/2406
dc.language.iso.fl_str_mv	spa
language	spa
dc.rights.none.fl_str_mv	Restringido info:eu-repo/semantics/restrictedAccess
dc.rights.coar.fl_str_mv	http://purl.org/coar/access_right/c_16ec
dc.rights.cc.spa.fl_str_mv	Restringido
dc.rights.accessrights.none.fl_str_mv	info:eu-repo/semantics/restrictedAccess
dc.rights.creativecommons.none.fl_str_mv	https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.creativecommons.spa.fl_str_mv	atribucionnocomercialsinderivar
rights_invalid_str_mv	Restringido https://creativecommons.org/licenses/by-nc-nd/4.0/ atribucionnocomercialsinderivar http://purl.org/coar/access_right/c_16ec
eu_rights_str_mv	restrictedAccess
dc.format.spa.fl_str_mv	text
dc.publisher.spa.fl_str_mv	Universidad del Magdalena
dc.publisher.department.spa.fl_str_mv	Facultad de Ingeniería
dc.publisher.program.spa.fl_str_mv	Ingeniería de Sistemas
dc.publisher.place.spa.fl_str_mv	Santa Marta
institution	Universidad del Magdalena
bitstream.url.fl_str_mv	http://localhost:4000/bitstreams/4ec5c7e7-37e4-4eb4-9e33-3750f704c94f/download http://localhost:4000/bitstreams/e7ead366-394e-4a66-88e2-e435c2c915b2/download http://localhost:4000/bitstreams/f94c4f90-b00a-4e4a-a5f6-7c783a34b309/download
bitstream.checksum.fl_str_mv	0b5e0dedab74927c9f05613f7d8a7b2c b37f3126bcd22eeae85cbc2659ee387b 2244a3dd1f6c27208a66f086dab0376d
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5
repository.name.fl_str_mv	DSpace Started with Docker Compose
repository.mail.fl_str_mv	dspace-help@myu.edu
_version_	1855544742638518272

Co-Evolucion competitiva de agentes de aprendizaje por refuerzo en un dominio de competencia de autos

Publicaciones similares