Testing deep reinforcement learning using genetic algorithms
El aprendizaje por refuerzo profundo (DRL) es la combinación del aprendizaje por refuerzo (RL) y las redes neuronales profundas (DNN), lo que habilita entradas de altas dimensiones, permitiendo con esto, el desarrollo de aplicaciones más complejas que aquellas que utilizan únicamente uno de estos mé...
- Autores:
-
León Cure, María del Rosario
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2020
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- eng
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/49048
- Acceso en línea:
- http://hdl.handle.net/1992/49048
- Palabra clave:
- Algoritmos genéticos
Desarrollo de software
Redes neurales (Computadores)
Robots
Ingeniería
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/4.0/
id |
UNIANDES2_0f04148e48a7fec1a20295d31cddcb25 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/49048 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.es_CO.fl_str_mv |
Testing deep reinforcement learning using genetic algorithms |
title |
Testing deep reinforcement learning using genetic algorithms |
spellingShingle |
Testing deep reinforcement learning using genetic algorithms Algoritmos genéticos Desarrollo de software Redes neurales (Computadores) Robots Ingeniería |
title_short |
Testing deep reinforcement learning using genetic algorithms |
title_full |
Testing deep reinforcement learning using genetic algorithms |
title_fullStr |
Testing deep reinforcement learning using genetic algorithms |
title_full_unstemmed |
Testing deep reinforcement learning using genetic algorithms |
title_sort |
Testing deep reinforcement learning using genetic algorithms |
dc.creator.fl_str_mv |
León Cure, María del Rosario |
dc.contributor.advisor.none.fl_str_mv |
Linares Vásquez, Mario |
dc.contributor.author.none.fl_str_mv |
León Cure, María del Rosario |
dc.subject.armarc.es_CO.fl_str_mv |
Algoritmos genéticos Desarrollo de software Redes neurales (Computadores) Robots |
topic |
Algoritmos genéticos Desarrollo de software Redes neurales (Computadores) Robots Ingeniería |
dc.subject.themes.none.fl_str_mv |
Ingeniería |
description |
El aprendizaje por refuerzo profundo (DRL) es la combinación del aprendizaje por refuerzo (RL) y las redes neuronales profundas (DNN), lo que habilita entradas de altas dimensiones, permitiendo con esto, el desarrollo de aplicaciones más complejas que aquellas que utilizan únicamente uno de estos métodos. Actualmente, el uso de DRL varia desde aplicaciones de baja criticidad, como videojuegos y robótica, hasta usos de alta criticidad como lo son software en el sistema de salud y carros autónomos. Dada la criticidad de algunos de estos sistemas, su confianza, calidad y fiabilidad deben ser probados rigurosamente; sin embargo, en la actualidad, no existe una técnica de pruebas propuesta que sea considerada como adecuada para sistemas basados en DRL. Por el contrario, estudios demuestran que las técnicas utilizadas comúnmente, pueden no ser el mejor enfoque dado que no tienen en consideración el proceso de aprendizaje único de estos sistemas. Por el momento, las técnicas utilizadas para realizar estas pruebas, son aquellas que fueron diseñadas para el aprendizaje profundo y las redes neuronales profundas, como lo son la cobertura neuronal, la ejecución simbólica y métodos estadísticos. Sin embargo, el hecho de que estas técnicas den buenos resultados en estos métodos, no garantiza el mismo resultado optimo en el aprendizaje por refuerzo profundo. El objetivo de este proyecto es proponer y probar una técnica de pruebas para DRL |
publishDate |
2020 |
dc.date.issued.none.fl_str_mv |
2020 |
dc.date.accessioned.none.fl_str_mv |
2021-02-18T12:39:52Z |
dc.date.available.none.fl_str_mv |
2021-02-18T12:39:52Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/49048 |
dc.identifier.pdf.none.fl_str_mv |
u833754.pdf |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/49048 |
identifier_str_mv |
u833754.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.es_CO.fl_str_mv |
eng |
language |
eng |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.es_CO.fl_str_mv |
29 hojas |
dc.format.mimetype.es_CO.fl_str_mv |
application/pdf |
dc.publisher.es_CO.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.es_CO.fl_str_mv |
Ingeniería de Sistemas y Computación |
dc.publisher.faculty.es_CO.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.es_CO.fl_str_mv |
Departamento de Ingeniería de Sistemas y Computación |
dc.source.es_CO.fl_str_mv |
instname:Universidad de los Andes reponame:Repositorio Institucional Séneca |
instname_str |
Universidad de los Andes |
institution |
Universidad de los Andes |
reponame_str |
Repositorio Institucional Séneca |
collection |
Repositorio Institucional Séneca |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/a3e9fa13-03f4-4bb8-b2ff-b4cee1ddeb2c/download https://repositorio.uniandes.edu.co/bitstreams/9eaff79c-c764-45d8-b784-cd24d654c5a6/download https://repositorio.uniandes.edu.co/bitstreams/93808b6b-a85a-4cae-8e33-ba4d349ef45f/download |
bitstream.checksum.fl_str_mv |
d66b3bfd5418fc7d4c3f31cb0a7a97be 75ebc1662aa4583861e20df356aebf28 95de3b76312d7b9ba843712e68d8cb63 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812133957233278976 |
spelling |
Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Linares Vásquez, Mariob7d30f76-a0a9-4002-a462-7e59ba954cf2400León Cure, María del Rosariodc720d0d-974f-4b95-817f-1975b3ff7c425002021-02-18T12:39:52Z2021-02-18T12:39:52Z2020http://hdl.handle.net/1992/49048u833754.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/El aprendizaje por refuerzo profundo (DRL) es la combinación del aprendizaje por refuerzo (RL) y las redes neuronales profundas (DNN), lo que habilita entradas de altas dimensiones, permitiendo con esto, el desarrollo de aplicaciones más complejas que aquellas que utilizan únicamente uno de estos métodos. Actualmente, el uso de DRL varia desde aplicaciones de baja criticidad, como videojuegos y robótica, hasta usos de alta criticidad como lo son software en el sistema de salud y carros autónomos. Dada la criticidad de algunos de estos sistemas, su confianza, calidad y fiabilidad deben ser probados rigurosamente; sin embargo, en la actualidad, no existe una técnica de pruebas propuesta que sea considerada como adecuada para sistemas basados en DRL. Por el contrario, estudios demuestran que las técnicas utilizadas comúnmente, pueden no ser el mejor enfoque dado que no tienen en consideración el proceso de aprendizaje único de estos sistemas. Por el momento, las técnicas utilizadas para realizar estas pruebas, son aquellas que fueron diseñadas para el aprendizaje profundo y las redes neuronales profundas, como lo son la cobertura neuronal, la ejecución simbólica y métodos estadísticos. Sin embargo, el hecho de que estas técnicas den buenos resultados en estos métodos, no garantiza el mismo resultado optimo en el aprendizaje por refuerzo profundo. El objetivo de este proyecto es proponer y probar una técnica de pruebas para DRLDeep reinforcement learning (DRL) is the use of both reinforcement learning and deep neural networks (DNN) which enable high-dimensional inputs, allowing the development of more complex applications than those that only use one of these methods. The current uses of this machine learning method range from videogames and robotics to critical software applications such as autonomous driving and healthcare systems. Given the criticality of these applications, they have to be rigorously tested for reliability, confidence and quality of the software. However, there are currently no software testing techniques proposed as suitable for addressing DRL based systems. Actually, early analysis suggests that existing techniques might not be the right approach as they do not take into account the learning process takes place in these systems. In the present day, DRL testing is done by using the same approaches designed for reinforcement learning and deep neural networks, such as neuronal coverage, symbolic execution, statistical methods, combinatorial testing, etc. Nevertheless, the fact that these approaches have good results in testing these methods does not assure the same optimal results for deep reinforcement learning. In this project the goal is to propose and test a new approach for DRL testingIngeniero de Sistemas y ComputaciónPregrado29 hojasapplication/pdfengUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y Computacióninstname:Universidad de los Andesreponame:Repositorio Institucional SénecaTesting deep reinforcement learning using genetic algorithmsTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPAlgoritmos genéticosDesarrollo de softwareRedes neurales (Computadores)RobotsIngenieríaPublicationTHUMBNAILu833754.pdf.jpgu833754.pdf.jpgIM Thumbnailimage/jpeg5201https://repositorio.uniandes.edu.co/bitstreams/a3e9fa13-03f4-4bb8-b2ff-b4cee1ddeb2c/downloadd66b3bfd5418fc7d4c3f31cb0a7a97beMD55ORIGINALu833754.pdfapplication/pdf949516https://repositorio.uniandes.edu.co/bitstreams/9eaff79c-c764-45d8-b784-cd24d654c5a6/download75ebc1662aa4583861e20df356aebf28MD51TEXTu833754.pdf.txtu833754.pdf.txtExtracted texttext/plain34725https://repositorio.uniandes.edu.co/bitstreams/93808b6b-a85a-4cae-8e33-ba4d349ef45f/download95de3b76312d7b9ba843712e68d8cb63MD541992/49048oai:repositorio.uniandes.edu.co:1992/490482023-10-10 17:47:53.415http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co |