Testing deep reinforcement learning using genetic algorithms

El aprendizaje por refuerzo profundo (DRL) es la combinación del aprendizaje por refuerzo (RL) y las redes neuronales profundas (DNN), lo que habilita entradas de altas dimensiones, permitiendo con esto, el desarrollo de aplicaciones más complejas que aquellas que utilizan únicamente uno de estos mé...

Full description

Autores:
León Cure, María del Rosario
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2020
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
eng
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/49048
Acceso en línea:
http://hdl.handle.net/1992/49048
Palabra clave:
Algoritmos genéticos
Desarrollo de software
Redes neurales (Computadores)
Robots
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
Description
Summary:El aprendizaje por refuerzo profundo (DRL) es la combinación del aprendizaje por refuerzo (RL) y las redes neuronales profundas (DNN), lo que habilita entradas de altas dimensiones, permitiendo con esto, el desarrollo de aplicaciones más complejas que aquellas que utilizan únicamente uno de estos métodos. Actualmente, el uso de DRL varia desde aplicaciones de baja criticidad, como videojuegos y robótica, hasta usos de alta criticidad como lo son software en el sistema de salud y carros autónomos. Dada la criticidad de algunos de estos sistemas, su confianza, calidad y fiabilidad deben ser probados rigurosamente; sin embargo, en la actualidad, no existe una técnica de pruebas propuesta que sea considerada como adecuada para sistemas basados en DRL. Por el contrario, estudios demuestran que las técnicas utilizadas comúnmente, pueden no ser el mejor enfoque dado que no tienen en consideración el proceso de aprendizaje único de estos sistemas. Por el momento, las técnicas utilizadas para realizar estas pruebas, son aquellas que fueron diseñadas para el aprendizaje profundo y las redes neuronales profundas, como lo son la cobertura neuronal, la ejecución simbólica y métodos estadísticos. Sin embargo, el hecho de que estas técnicas den buenos resultados en estos métodos, no garantiza el mismo resultado optimo en el aprendizaje por refuerzo profundo. El objetivo de este proyecto es proponer y probar una técnica de pruebas para DRL