Clasificación taxonómica de bacterias usando machine learning

La clasificación taxonómica de bacterias es de gran interés para la comunidad científica por sus diversas aplicaciones como en la industria y la biotecnología. El ADN contiene la información necesaria para realizar una correcta clasificación de taxones, reduciendo las posibilidades de error en compa...

Full description

Autores:
Golondrino Fernández, Laura Guadalupe
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2020
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/49457
Acceso en línea:
http://hdl.handle.net/1992/49457
Palabra clave:
Secuencia de nucleótidos
Aprendizaje automático (Inteligencia artificial)
Genomas bacterianos
Ingeniería
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id UNIANDES2_9c03cfe78891519842440dffd3cf8782
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/49457
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.es_CO.fl_str_mv Clasificación taxonómica de bacterias usando machine learning
title Clasificación taxonómica de bacterias usando machine learning
spellingShingle Clasificación taxonómica de bacterias usando machine learning
Secuencia de nucleótidos
Aprendizaje automático (Inteligencia artificial)
Genomas bacterianos
Ingeniería
title_short Clasificación taxonómica de bacterias usando machine learning
title_full Clasificación taxonómica de bacterias usando machine learning
title_fullStr Clasificación taxonómica de bacterias usando machine learning
title_full_unstemmed Clasificación taxonómica de bacterias usando machine learning
title_sort Clasificación taxonómica de bacterias usando machine learning
dc.creator.fl_str_mv Golondrino Fernández, Laura Guadalupe
dc.contributor.advisor.none.fl_str_mv Lozano Martínez, Fernando Enrique
dc.contributor.author.none.fl_str_mv Golondrino Fernández, Laura Guadalupe
dc.contributor.jury.none.fl_str_mv Higuera Arias, Carolina
Giraldo Trujillo, Luis Felipe
dc.subject.armarc.es_CO.fl_str_mv Secuencia de nucleótidos
Aprendizaje automático (Inteligencia artificial)
Genomas bacterianos
topic Secuencia de nucleótidos
Aprendizaje automático (Inteligencia artificial)
Genomas bacterianos
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description La clasificación taxonómica de bacterias es de gran interés para la comunidad científica por sus diversas aplicaciones como en la industria y la biotecnología. El ADN contiene la información necesaria para realizar una correcta clasificación de taxones, reduciendo las posibilidades de error en comparación a realizar la tarea de clasificación por medio de cultivos en un laboratorio. Sin embargo, analizar secuencias de ADN también es una labor muy complicada y consume bastante tiempo. Este trabajo propone una forma de clasificar bacterias por medio de secuencias de ADN usando modelos de machine learning, asimismo, reducir el error y el tiempo en la clasificación de taxones. En base a la bibliografía consultada se crearon diferentes modelos de machine learning: redes neuronales multicapa y redes neuronales convolucionales para la clasificación de un grupo de bacterias. Los resultados obtenidos con cada modelo evidencian un buen desempeño en los taxones de mayor jerarquía, pero para los taxones menores se necesita buscar nuevos modelos para mejorar el desempeño. No obstante, con el trabajo realizado se demuestra que el uso de machine learning es una solución más rápida y eficiente para analizar secuencias de ADN de bacterias y clasificarlas taxonómicamente
publishDate 2020
dc.date.issued.none.fl_str_mv 2020
dc.date.accessioned.none.fl_str_mv 2021-03-01T09:28:30Z
dc.date.available.none.fl_str_mv 2021-03-01T09:28:30Z
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/49457
dc.identifier.pdf.none.fl_str_mv u837714.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/49457
identifier_str_mv u837714.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 38 hojas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Uniandes
dc.publisher.program.es_CO.fl_str_mv Ingeniería Electrónica
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ingeniería
dc.publisher.department.es_CO.fl_str_mv Departamento de Ingeniería Eléctrica y Electrónica
dc.source.es_CO.fl_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
instname_str Universidad de los Andes
institution Universidad de los Andes
reponame_str Repositorio Institucional Séneca
collection Repositorio Institucional Séneca
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/6807e2ed-83f4-4472-9b13-5f12574bf8d8/download
https://repositorio.uniandes.edu.co/bitstreams/68f8e569-6fc6-460e-9186-72df6aefc0a8/download
https://repositorio.uniandes.edu.co/bitstreams/2e6e5c88-ff73-4c08-afae-81aac9f342c8/download
bitstream.checksum.fl_str_mv b859d2833f254544075451a89f063cd4
afbea55c3f9d11fabc7d78198c022197
9a4a0a28c12f19c2c5dd9efa9d32df16
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133805250576384
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Lozano Martínez, Fernando Enrique4b3dc2ea-9e3f-43cd-aabe-2b4567602c46400Golondrino Fernández, Laura Guadalupe9ff82d91-fe9e-4356-b5b0-5af1bd7020c4500Higuera Arias, CarolinaGiraldo Trujillo, Luis Felipe2021-03-01T09:28:30Z2021-03-01T09:28:30Z2020http://hdl.handle.net/1992/49457u837714.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/La clasificación taxonómica de bacterias es de gran interés para la comunidad científica por sus diversas aplicaciones como en la industria y la biotecnología. El ADN contiene la información necesaria para realizar una correcta clasificación de taxones, reduciendo las posibilidades de error en comparación a realizar la tarea de clasificación por medio de cultivos en un laboratorio. Sin embargo, analizar secuencias de ADN también es una labor muy complicada y consume bastante tiempo. Este trabajo propone una forma de clasificar bacterias por medio de secuencias de ADN usando modelos de machine learning, asimismo, reducir el error y el tiempo en la clasificación de taxones. En base a la bibliografía consultada se crearon diferentes modelos de machine learning: redes neuronales multicapa y redes neuronales convolucionales para la clasificación de un grupo de bacterias. Los resultados obtenidos con cada modelo evidencian un buen desempeño en los taxones de mayor jerarquía, pero para los taxones menores se necesita buscar nuevos modelos para mejorar el desempeño. No obstante, con el trabajo realizado se demuestra que el uso de machine learning es una solución más rápida y eficiente para analizar secuencias de ADN de bacterias y clasificarlas taxonómicamenteThe taxonomic classification of bacteria is of great interest to the scientific community due to its various applications such as in industry and biotechnology. DNA contains the information necessary to carry out a correct classification of taxa, reducing the chances of error compared to performing the classification task through cultures in a laboratory. However, analyzing DNA sequences is also very complicated and time consuming. This work proposes a way to classify bacteria by DNA sequences using machine learning models, also, reduce error and time in taxa classification. Based on the bibliography consulted, different machine learning models were created: multilayer neural networks and convolutional neural networks for the classification of a group of bacteria. The results obtained with each model show a good performance in the highest-hierarchy taxa, but for minor taxa is necessary to find new models to improve performance. However, the work carried out shows that the use of machine learning models is a faster and more efficient solution to analyze DNA sequences of bacteria and classify them taxonomicallyIngeniero ElectrónicoPregrado38 hojasapplication/pdfspaUniandesIngeniería ElectrónicaFacultad de IngenieríaDepartamento de Ingeniería Eléctrica y Electrónicainstname:Universidad de los Andesreponame:Repositorio Institucional SénecaClasificación taxonómica de bacterias usando machine learningTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPSecuencia de nucleótidosAprendizaje automático (Inteligencia artificial)Genomas bacterianosIngenieríaPublicationTHUMBNAILu837714.pdf.jpgu837714.pdf.jpgIM Thumbnailimage/jpeg6517https://repositorio.uniandes.edu.co/bitstreams/6807e2ed-83f4-4472-9b13-5f12574bf8d8/downloadb859d2833f254544075451a89f063cd4MD55TEXTu837714.pdf.txtu837714.pdf.txtExtracted texttext/plain41191https://repositorio.uniandes.edu.co/bitstreams/68f8e569-6fc6-460e-9186-72df6aefc0a8/downloadafbea55c3f9d11fabc7d78198c022197MD54ORIGINALu837714.pdfapplication/pdf1043888https://repositorio.uniandes.edu.co/bitstreams/2e6e5c88-ff73-4c08-afae-81aac9f342c8/download9a4a0a28c12f19c2c5dd9efa9d32df16MD511992/49457oai:repositorio.uniandes.edu.co:1992/494572023-10-10 15:18:05.443https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co