Neural networks that express multiple strategies in the video game StarCraft 2

ilustraciones

Autores:
González Duque, Miguel
Tipo de recurso:
Fecha de publicación:
2019
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
eng
OAI Identifier:
oai:repositorio.unal.edu.co:unal/77095
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/77095
http://bdigital.unal.edu.co/74472/
https://repositorio.unal.edu.co/
Palabra clave:
Supervised Learning
Dimensionality Reduction
Neural Networks
StarCraft 2
Behavioral Repertoires Imitation Learning
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_8de73db1026c88bfdd86396b9ac55f34
oai_identifier_str oai:repositorio.unal.edu.co:unal/77095
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Neural networks that express multiple strategies in the video game StarCraft 2
dc.title.translated.spa.fl_str_mv Redes neuronales que expresan múltiples estrategias en el videojuego StarCraft 2.
title Neural networks that express multiple strategies in the video game StarCraft 2
spellingShingle Neural networks that express multiple strategies in the video game StarCraft 2
Supervised Learning
Dimensionality Reduction
Neural Networks
StarCraft 2
Behavioral Repertoires Imitation Learning
title_short Neural networks that express multiple strategies in the video game StarCraft 2
title_full Neural networks that express multiple strategies in the video game StarCraft 2
title_fullStr Neural networks that express multiple strategies in the video game StarCraft 2
title_full_unstemmed Neural networks that express multiple strategies in the video game StarCraft 2
title_sort Neural networks that express multiple strategies in the video game StarCraft 2
dc.creator.fl_str_mv González Duque, Miguel
dc.contributor.advisor.spa.fl_str_mv Cabarcas Jaramillo, Daniel
dc.contributor.author.spa.fl_str_mv González Duque, Miguel
dc.subject.proposal.spa.fl_str_mv Supervised Learning
Dimensionality Reduction
Neural Networks
StarCraft 2
Behavioral Repertoires Imitation Learning
topic Supervised Learning
Dimensionality Reduction
Neural Networks
StarCraft 2
Behavioral Repertoires Imitation Learning
description ilustraciones
publishDate 2019
dc.date.issued.spa.fl_str_mv 2019-10-03
dc.date.accessioned.spa.fl_str_mv 2020-03-30T06:38:31Z
dc.date.available.spa.fl_str_mv 2020-03-30T06:38:31Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/77095
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/74472/
dc.identifier.instname.spa.fl_str_mv Universidad Nacional de Colombia
dc.identifier.reponame.spa.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
dc.identifier.repourl.spa.fl_str_mv https://repositorio.unal.edu.co/
url https://repositorio.unal.edu.co/handle/unal/77095
http://bdigital.unal.edu.co/74472/
https://repositorio.unal.edu.co/
identifier_str_mv Universidad Nacional de Colombia
Repositorio Institucional Universidad Nacional de Colombia
dc.language.iso.spa.fl_str_mv eng
language eng
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de Matemáticas
Escuela de Matemáticas
dc.relation.haspart.spa.fl_str_mv 51 Matemáticas / Mathematics
dc.relation.references.spa.fl_str_mv González Duque, Miguel (2019) Neural networks that express multiple strategies in the video game StarCraft 2. Maestría thesis, Universidad Nacional de Colombia, sede Medellín.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 70 páginas
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.program.spa.fl_str_mv Maestría en Ciencias - Matemática
dc.publisher.department.spa.fl_str_mv Escuela de Matemáticas
dc.publisher.editor.spa.fl_str_mv Universidad Nacional de Colombia
dc.publisher.faculty.spa.fl_str_mv Facultad de Ciencias
dc.publisher.place.spa.fl_str_mv Medellín
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/77095/1/1053838200.2019.pdf
https://repositorio.unal.edu.co/bitstream/unal/77095/2/1053838200.2019.pdf.jpg
bitstream.checksum.fl_str_mv bbb8420643574c333cf7f7d58cfdbc07
96d18c3e73aa8c7f3ca45c778d118220
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1806885988902895616
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Cabarcas Jaramillo, Daniel9523b5dcc283edd60a465e234d239f3c300González Duque, Miguel0b07f1f6-13be-4b7e-a982-29577e82f9fd3002020-03-30T06:38:31Z2020-03-30T06:38:31Z2019-10-03https://repositorio.unal.edu.co/handle/unal/77095http://bdigital.unal.edu.co/74472/Universidad Nacional de ColombiaRepositorio Institucional Universidad Nacional de Colombiahttps://repositorio.unal.edu.co/ilustracionesUsing neural networks and supervised learning, we have created models capable of solving problems at a superhuman level. Nevertheless, this training process results in models that learn policies that average the plethora of behaviors usually found in datasets. In this thesis we present and study the Behavioral Repetoires Imitation Learning (BRIL) technique. In BRIL, the user designs a behavior space, the user then projects this behavior space into low coordinates and uses these coordinates as input to the model. Upon deployment, the user can adjust the model to express a behavior by specifying fixed coordinates for these inputs. The main research question ponders on the relationship between the Dimension Reduction algorithm and how much the trained models are able to replicate behaviors. We study three different Dimensionality Reduction algorithms: Principal Component Analysis (PCA), Isometric Feature Mapping (Isomap) and Uniform Manifold Approximation and Projection (UMAP); we design and embed a behavior space in the video game StarCraft 2, we train different models for each embedding and we test the ability of each model to express multiple strategies. Results show that with BRIL we are able to train models that are able to express the multiple behaviors present in the dataset. The geometric structure these methods preserve induce different separations of behaviors, and these separations are reflected in the models' conducts. (Tomado de la fuente)Usando redes neuronales y aprendizaje supervisado, hemos creado modelos capaces de solucionar problemas a nivel súperhumano. Sin embargo, el proceso de entrenamiento de estos modelos es tal que el resultado es una política que promedia todos los diferentes comportamientos presentes en el conjunto de datos. En esta tesis presentamos y estudiamos la técnica Aprendizaje por Imitación de Repertorios de Comportamiento (BRIL), la cual permite entrenar modelos que expresan múltiples comportamientos de forma ajustable. En BRIL, el usuario diseña un espacio de comportamientos, lo proyecta a bajas dimensiones y usa las coordenadas resultantes como entradas del modelo. Para poder expresar cierto comportamiento a la hora de desplegar la red, basta con fijar estas entradas a las coordenadas del respectivo comportamiento. La pregunta principal que investigamos es la relación entre el algoritmo de reducción de dimensionalidad y la capacidad de los modelos entrenados para replicar y expresar las estrategias representadas. Estudiamos tres algoritmos diferentes de reducción de dimensionalidad: Análisis de Componentes Principales (PCA), Mapeo de Características Isométrico (Isomap) y Aproximación y Proyección de Manifolds Uniformes (UMAP); diseñamos y proyectamos un espacio de comportamientos en el videojuego StarCraft 2, entrenamos diferentes modelos para cada embebimiento y probamos la capacidad de cada modelo de expresar múltiples estrategias. Los resultados muestran que, usando BRIL, logramos entrenar modelos que pueden expresar los múltiples comportamientos presentes en el conjunto de datos. La estructura geométrica preservada por cada método de reducción induce diferentes separaciones de los comportamientos, y estas separaciones se ven reflejadas en las conductas de los modelos. (Tomado de la fuente)Maestría70 páginasapplication/pdfengUniversidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de MatemáticasEscuela de Matemáticas51 Matemáticas / MathematicsGonzález Duque, Miguel (2019) Neural networks that express multiple strategies in the video game StarCraft 2. Maestría thesis, Universidad Nacional de Colombia, sede Medellín.Neural networks that express multiple strategies in the video game StarCraft 2Redes neuronales que expresan múltiples estrategias en el videojuego StarCraft 2.Trabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMMaestría en Ciencias - MatemáticaEscuela de MatemáticasUniversidad Nacional de ColombiaFacultad de CienciasMedellínEspecializadaSupervised LearningDimensionality ReductionNeural NetworksStarCraft 2Behavioral Repertoires Imitation LearningORIGINAL1053838200.2019.pdfTesis de Maestría en Ciencias - Matemáticasapplication/pdf5106877https://repositorio.unal.edu.co/bitstream/unal/77095/1/1053838200.2019.pdfbbb8420643574c333cf7f7d58cfdbc07MD51THUMBNAIL1053838200.2019.pdf.jpg1053838200.2019.pdf.jpgGenerated Thumbnailimage/jpeg4177https://repositorio.unal.edu.co/bitstream/unal/77095/2/1053838200.2019.pdf.jpg96d18c3e73aa8c7f3ca45c778d118220MD52unal/77095oai:repositorio.unal.edu.co:unal/770952023-07-17 23:03:46.241Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co