Testing deep reinforcement learning using genetic algorithms

El aprendizaje por refuerzo profundo (DRL) es la combinación del aprendizaje por refuerzo (RL) y las redes neuronales profundas (DNN), lo que habilita entradas de altas dimensiones, permitiendo con esto, el desarrollo de aplicaciones más complejas que aquellas que utilizan únicamente uno de estos mé...

Full description

Autores:
León Cure, María del Rosario
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2020
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
eng
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/49048
Acceso en línea:
http://hdl.handle.net/1992/49048
Palabra clave:
Algoritmos genéticos
Desarrollo de software
Redes neurales (Computadores)
Robots
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
id UNIANDES2_0f04148e48a7fec1a20295d31cddcb25
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/49048
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.es_CO.fl_str_mv Testing deep reinforcement learning using genetic algorithms
title Testing deep reinforcement learning using genetic algorithms
spellingShingle Testing deep reinforcement learning using genetic algorithms
Algoritmos genéticos
Desarrollo de software
Redes neurales (Computadores)
Robots
Ingeniería
title_short Testing deep reinforcement learning using genetic algorithms
title_full Testing deep reinforcement learning using genetic algorithms
title_fullStr Testing deep reinforcement learning using genetic algorithms
title_full_unstemmed Testing deep reinforcement learning using genetic algorithms
title_sort Testing deep reinforcement learning using genetic algorithms
dc.creator.fl_str_mv León Cure, María del Rosario
dc.contributor.advisor.none.fl_str_mv Linares Vásquez, Mario
dc.contributor.author.none.fl_str_mv León Cure, María del Rosario
dc.subject.armarc.es_CO.fl_str_mv Algoritmos genéticos
Desarrollo de software
Redes neurales (Computadores)
Robots
topic Algoritmos genéticos
Desarrollo de software
Redes neurales (Computadores)
Robots
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description El aprendizaje por refuerzo profundo (DRL) es la combinación del aprendizaje por refuerzo (RL) y las redes neuronales profundas (DNN), lo que habilita entradas de altas dimensiones, permitiendo con esto, el desarrollo de aplicaciones más complejas que aquellas que utilizan únicamente uno de estos métodos. Actualmente, el uso de DRL varia desde aplicaciones de baja criticidad, como videojuegos y robótica, hasta usos de alta criticidad como lo son software en el sistema de salud y carros autónomos. Dada la criticidad de algunos de estos sistemas, su confianza, calidad y fiabilidad deben ser probados rigurosamente; sin embargo, en la actualidad, no existe una técnica de pruebas propuesta que sea considerada como adecuada para sistemas basados en DRL. Por el contrario, estudios demuestran que las técnicas utilizadas comúnmente, pueden no ser el mejor enfoque dado que no tienen en consideración el proceso de aprendizaje único de estos sistemas. Por el momento, las técnicas utilizadas para realizar estas pruebas, son aquellas que fueron diseñadas para el aprendizaje profundo y las redes neuronales profundas, como lo son la cobertura neuronal, la ejecución simbólica y métodos estadísticos. Sin embargo, el hecho de que estas técnicas den buenos resultados en estos métodos, no garantiza el mismo resultado optimo en el aprendizaje por refuerzo profundo. El objetivo de este proyecto es proponer y probar una técnica de pruebas para DRL
publishDate 2020
dc.date.issued.none.fl_str_mv 2020
dc.date.accessioned.none.fl_str_mv 2021-02-18T12:39:52Z
dc.date.available.none.fl_str_mv 2021-02-18T12:39:52Z
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/49048
dc.identifier.pdf.none.fl_str_mv u833754.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/49048
identifier_str_mv u833754.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv eng
language eng
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 29 hojas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv Ingeniería de Sistemas y Computación
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ingeniería
dc.publisher.department.es_CO.fl_str_mv Departamento de Ingeniería de Sistemas y Computación
dc.source.es_CO.fl_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
instname_str Universidad de los Andes
institution Universidad de los Andes
reponame_str Repositorio Institucional Séneca
collection Repositorio Institucional Séneca
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/a3e9fa13-03f4-4bb8-b2ff-b4cee1ddeb2c/download
https://repositorio.uniandes.edu.co/bitstreams/9eaff79c-c764-45d8-b784-cd24d654c5a6/download
https://repositorio.uniandes.edu.co/bitstreams/93808b6b-a85a-4cae-8e33-ba4d349ef45f/download
bitstream.checksum.fl_str_mv d66b3bfd5418fc7d4c3f31cb0a7a97be
75ebc1662aa4583861e20df356aebf28
95de3b76312d7b9ba843712e68d8cb63
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133957233278976
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Linares Vásquez, Mariob7d30f76-a0a9-4002-a462-7e59ba954cf2400León Cure, María del Rosariodc720d0d-974f-4b95-817f-1975b3ff7c425002021-02-18T12:39:52Z2021-02-18T12:39:52Z2020http://hdl.handle.net/1992/49048u833754.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/El aprendizaje por refuerzo profundo (DRL) es la combinación del aprendizaje por refuerzo (RL) y las redes neuronales profundas (DNN), lo que habilita entradas de altas dimensiones, permitiendo con esto, el desarrollo de aplicaciones más complejas que aquellas que utilizan únicamente uno de estos métodos. Actualmente, el uso de DRL varia desde aplicaciones de baja criticidad, como videojuegos y robótica, hasta usos de alta criticidad como lo son software en el sistema de salud y carros autónomos. Dada la criticidad de algunos de estos sistemas, su confianza, calidad y fiabilidad deben ser probados rigurosamente; sin embargo, en la actualidad, no existe una técnica de pruebas propuesta que sea considerada como adecuada para sistemas basados en DRL. Por el contrario, estudios demuestran que las técnicas utilizadas comúnmente, pueden no ser el mejor enfoque dado que no tienen en consideración el proceso de aprendizaje único de estos sistemas. Por el momento, las técnicas utilizadas para realizar estas pruebas, son aquellas que fueron diseñadas para el aprendizaje profundo y las redes neuronales profundas, como lo son la cobertura neuronal, la ejecución simbólica y métodos estadísticos. Sin embargo, el hecho de que estas técnicas den buenos resultados en estos métodos, no garantiza el mismo resultado optimo en el aprendizaje por refuerzo profundo. El objetivo de este proyecto es proponer y probar una técnica de pruebas para DRLDeep reinforcement learning (DRL) is the use of both reinforcement learning and deep neural networks (DNN) which enable high-dimensional inputs, allowing the development of more complex applications than those that only use one of these methods. The current uses of this machine learning method range from videogames and robotics to critical software applications such as autonomous driving and healthcare systems. Given the criticality of these applications, they have to be rigorously tested for reliability, confidence and quality of the software. However, there are currently no software testing techniques proposed as suitable for addressing DRL based systems. Actually, early analysis suggests that existing techniques might not be the right approach as they do not take into account the learning process takes place in these systems. In the present day, DRL testing is done by using the same approaches designed for reinforcement learning and deep neural networks, such as neuronal coverage, symbolic execution, statistical methods, combinatorial testing, etc. Nevertheless, the fact that these approaches have good results in testing these methods does not assure the same optimal results for deep reinforcement learning. In this project the goal is to propose and test a new approach for DRL testingIngeniero de Sistemas y ComputaciónPregrado29 hojasapplication/pdfengUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y Computacióninstname:Universidad de los Andesreponame:Repositorio Institucional SénecaTesting deep reinforcement learning using genetic algorithmsTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPAlgoritmos genéticosDesarrollo de softwareRedes neurales (Computadores)RobotsIngenieríaPublicationTHUMBNAILu833754.pdf.jpgu833754.pdf.jpgIM Thumbnailimage/jpeg5201https://repositorio.uniandes.edu.co/bitstreams/a3e9fa13-03f4-4bb8-b2ff-b4cee1ddeb2c/downloadd66b3bfd5418fc7d4c3f31cb0a7a97beMD55ORIGINALu833754.pdfapplication/pdf949516https://repositorio.uniandes.edu.co/bitstreams/9eaff79c-c764-45d8-b784-cd24d654c5a6/download75ebc1662aa4583861e20df356aebf28MD51TEXTu833754.pdf.txtu833754.pdf.txtExtracted texttext/plain34725https://repositorio.uniandes.edu.co/bitstreams/93808b6b-a85a-4cae-8e33-ba4d349ef45f/download95de3b76312d7b9ba843712e68d8cb63MD541992/49048oai:repositorio.uniandes.edu.co:1992/490482023-10-10 17:47:53.415http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co