Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento

La producción actual a gran escala y a bajo costo de secuencias han permitido el auge de las aproximaciones metagenómicas para explorar la información genómica almacenada en los diversos ecosistemas del planeta. Esto brinda la oportunidad de experimentar nuevas metodologías para el mapeo de genes fu...

Full description

Autores:
Torres Estupiñan, Guillermo Gonzalo
Tipo de recurso:
Fecha de publicación:
2014
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/74993
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/74993
http://bdigital.unal.edu.co/39485/
Palabra clave:
55 Ciencias de la tierra / Earth sciences and geology
57 Ciencias de la vida; Biología / Life sciences; biology
Asignación por similitud
Ciclos biogeoquímicos
Diseño de sondas
Homology binning
Biogechemestry cycles
Probe design
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_22ff1e68f454eecead12a3d99fccd4a7
oai_identifier_str oai:repositorio.unal.edu.co:unal/74993
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento
title Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento
spellingShingle Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento
55 Ciencias de la tierra / Earth sciences and geology
57 Ciencias de la vida; Biología / Life sciences; biology
Asignación por similitud
Ciclos biogeoquímicos
Diseño de sondas
Homology binning
Biogechemestry cycles
Probe design
title_short Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento
title_full Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento
title_fullStr Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento
title_full_unstemmed Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento
title_sort Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento
dc.creator.fl_str_mv Torres Estupiñan, Guillermo Gonzalo
dc.contributor.author.spa.fl_str_mv Torres Estupiñan, Guillermo Gonzalo
dc.contributor.spa.fl_str_mv Barreto Hernández, Emiliano
dc.subject.ddc.spa.fl_str_mv 55 Ciencias de la tierra / Earth sciences and geology
57 Ciencias de la vida; Biología / Life sciences; biology
topic 55 Ciencias de la tierra / Earth sciences and geology
57 Ciencias de la vida; Biología / Life sciences; biology
Asignación por similitud
Ciclos biogeoquímicos
Diseño de sondas
Homology binning
Biogechemestry cycles
Probe design
dc.subject.proposal.spa.fl_str_mv Asignación por similitud
Ciclos biogeoquímicos
Diseño de sondas
Homology binning
Biogechemestry cycles
Probe design
description La producción actual a gran escala y a bajo costo de secuencias han permitido el auge de las aproximaciones metagenómicas para explorar la información genómica almacenada en los diversos ecosistemas del planeta. Esto brinda la oportunidad de experimentar nuevas metodologías para el mapeo de genes funcionales, de manera que se pueda estimar la capacidad funcional inherente de las comunidades microbianas. El Sistema de Hibridación In silico es una aproximación de clasificación taxonómica y funcional que implementa dos flujos de trabajo; un Creador de Sondas (CrSo) encargado de diseñar sondas a nivel taxonómico de genero a partir de las secuencias introducidas y un Hibridador In Silico Secuencial (HISS), que se encarga de hacer el proceso de hibridación entre las sondas generadas con las secuencias de la comunidad. El sistema de Hibridación In silico caracteriza comunidades edáficas evaluando el potencial funcional diferencial de los ciclos biogeoquímicos del Nitrógeno y el Fosforo, para lo cual se identificaron 73 reacciones claves que contaban con 63 familias enzimáticas y 47.419 secuencias nucleotídicas de las enzimas correspondientes a dichas familias. A partir de las secuencias nucleotídicas se diseñaron sondas con CrSo, para un total de 41.430 sondas divididas en 5 grupos de longitudes 25pb, 40pb, 60pb, 80pb y 100pb. A partir de las sondas diseñadas con CrSo y datos simulados de secuenciamiento con características de la plataforma illumina, se determinaron las condiciones de hibridación de HISS, las cuales consideraron como límite inferior de longitud de alineamiento 35pb para y un relación malos apareamientos - longitud de alineamiento descrita por la función logarítmica: !!=!9,6413!ln!!! −!30,483. Con esto se aseguró una sensibilidad y especificidad promedio de 85% y 95% respectivamente, para sondas de longitud 100pb. Bajo la previa parametrización de HISS, se determinó que la mejor forma de caracterizar una comunidad era utilizando la sonda de 100pb con mayor puntaje de especificidad, calculado por CrSo. Adicionalmente, bajo estas condiciones la sobre o sub estimación de genes de la población a muestrear es mínimo. La caracterización de una muestra edáfica real a través del sistema de Hibridación in silico permitió diferenciar claramente el potencial funcional del ecosistema, de su metabolismo activo, tanto desde el punto de vista génico y enzimático como también desde su componente organísmico. Este trabajo presenta una nueva aproximación de clasificación taxonómica y funcional de comunidades microbianas basada en una estrategia de similitud que no requiere un previo ensamblaje de secuencias. Dicha aproximación difiere del enfoque comúnmente utilizado, en que usa huellas genéticas (sondas) diseñadas para cada gen de interés y evalúa las características de los alineamientos que ellas obtienen con las secuencias de la comunidad en estudio.
publishDate 2014
dc.date.issued.spa.fl_str_mv 2014
dc.date.accessioned.spa.fl_str_mv 2019-07-03T18:51:15Z
dc.date.available.spa.fl_str_mv 2019-07-03T18:51:15Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/74993
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/39485/
url https://repositorio.unal.edu.co/handle/unal/74993
http://bdigital.unal.edu.co/39485/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de Biología
Departamento de Biología
dc.relation.references.spa.fl_str_mv Torres Estupiñan, Guillermo Gonzalo (2014) Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento. Maestría thesis, Universidad Nacional de Colombia.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/74993/1/guillermotorrese.2014.pdf
https://repositorio.unal.edu.co/bitstream/unal/74993/2/guillermotorrese.2014.pdf.jpg
bitstream.checksum.fl_str_mv cf5d717f4e1376312bd4aada2c280c47
4aa2724f61a24b9c9613ce9ad0e02418
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089884178055168
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Barreto Hernández, EmilianoTorres Estupiñan, Guillermo Gonzalo625bb2a4-6cb1-4581-9c21-16904d330f333002019-07-03T18:51:15Z2019-07-03T18:51:15Z2014https://repositorio.unal.edu.co/handle/unal/74993http://bdigital.unal.edu.co/39485/La producción actual a gran escala y a bajo costo de secuencias han permitido el auge de las aproximaciones metagenómicas para explorar la información genómica almacenada en los diversos ecosistemas del planeta. Esto brinda la oportunidad de experimentar nuevas metodologías para el mapeo de genes funcionales, de manera que se pueda estimar la capacidad funcional inherente de las comunidades microbianas. El Sistema de Hibridación In silico es una aproximación de clasificación taxonómica y funcional que implementa dos flujos de trabajo; un Creador de Sondas (CrSo) encargado de diseñar sondas a nivel taxonómico de genero a partir de las secuencias introducidas y un Hibridador In Silico Secuencial (HISS), que se encarga de hacer el proceso de hibridación entre las sondas generadas con las secuencias de la comunidad. El sistema de Hibridación In silico caracteriza comunidades edáficas evaluando el potencial funcional diferencial de los ciclos biogeoquímicos del Nitrógeno y el Fosforo, para lo cual se identificaron 73 reacciones claves que contaban con 63 familias enzimáticas y 47.419 secuencias nucleotídicas de las enzimas correspondientes a dichas familias. A partir de las secuencias nucleotídicas se diseñaron sondas con CrSo, para un total de 41.430 sondas divididas en 5 grupos de longitudes 25pb, 40pb, 60pb, 80pb y 100pb. A partir de las sondas diseñadas con CrSo y datos simulados de secuenciamiento con características de la plataforma illumina, se determinaron las condiciones de hibridación de HISS, las cuales consideraron como límite inferior de longitud de alineamiento 35pb para y un relación malos apareamientos - longitud de alineamiento descrita por la función logarítmica: !!=!9,6413!ln!!! −!30,483. Con esto se aseguró una sensibilidad y especificidad promedio de 85% y 95% respectivamente, para sondas de longitud 100pb. Bajo la previa parametrización de HISS, se determinó que la mejor forma de caracterizar una comunidad era utilizando la sonda de 100pb con mayor puntaje de especificidad, calculado por CrSo. Adicionalmente, bajo estas condiciones la sobre o sub estimación de genes de la población a muestrear es mínimo. La caracterización de una muestra edáfica real a través del sistema de Hibridación in silico permitió diferenciar claramente el potencial funcional del ecosistema, de su metabolismo activo, tanto desde el punto de vista génico y enzimático como también desde su componente organísmico. Este trabajo presenta una nueva aproximación de clasificación taxonómica y funcional de comunidades microbianas basada en una estrategia de similitud que no requiere un previo ensamblaje de secuencias. Dicha aproximación difiere del enfoque comúnmente utilizado, en que usa huellas genéticas (sondas) diseñadas para cada gen de interés y evalúa las características de los alineamientos que ellas obtienen con las secuencias de la comunidad en estudio.Abstract. Nowadays the widely production and low cost of sequencing has allowed the extent of metagenomics in order to explore the genomic information from diverse environments. This offers the opportunity to examine new approaches for the sequence binning and functional assignment. The In silico Hybridization System is an approach of functional assignment and gender taxonomic level binning working with two general pipelines: Probes Creator (CrSo) ordered to design DNA fingerprints to a gender taxonomic level, this probes will be used by the Sequential In silico Hybridator (HISS) to make the hybridization with the community reads. The In silico Hybridization System assesses the edaphic differential functional potential of Nitrogen and Phosphorus biochemical cycles, to do that, 73 key reactions with 63 enzyme families and 47.419 nucleotide sequences of them were identified. From those nucleotide sequences, CrSo design 41.430 probes. These probes make up 5 probe length groups, as follows: 25pb, 40pb, 60pb, 80pb and 100pb. The HISS hibridization conditions were set up with the probes designed by CrSo and likeillumina simulated reads. Therefore, was defined the alignment lenght threshold, in 35pb, and a relation between alignment lenght and mismatch described by a logarithmic function: !!=!9,6413!ln!!! −!30,483. With these parameters, HISS ensured a mean sensibility and specificity of 85% and 95% respectively for 100pb pobres length. Under these HISS parameteres, it was determined that the best way to characterize edaphic communities was with a the best CrSo specificity score of 100pb probe length, without gene under or sub estimates. The characterization of real edaphic sample through In silico Hybridization System, allowed clearly distinguish between the ecosistem’s functional potential of its active metabolism, since its genetic, enzymatic and organismic perspectives This work presents a new functional and taxonomical binning approach of microbial communities, it is based on homology strategy that do not require read assembling. This approach uses fingerprints (probes) for each gene target and assess the alignments homology characteristics of hibridization between probes and metagenome reads.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de BiologíaDepartamento de BiologíaTorres Estupiñan, Guillermo Gonzalo (2014) Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento. Maestría thesis, Universidad Nacional de Colombia.55 Ciencias de la tierra / Earth sciences and geology57 Ciencias de la vida; Biología / Life sciences; biologyAsignación por similitudCiclos biogeoquímicosDiseño de sondasHomology binningBiogechemestry cyclesProbe designDiseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimientoTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINALguillermotorrese.2014.pdfapplication/pdf4518213https://repositorio.unal.edu.co/bitstream/unal/74993/1/guillermotorrese.2014.pdfcf5d717f4e1376312bd4aada2c280c47MD51THUMBNAILguillermotorrese.2014.pdf.jpgguillermotorrese.2014.pdf.jpgGenerated Thumbnailimage/jpeg5932https://repositorio.unal.edu.co/bitstream/unal/74993/2/guillermotorrese.2014.pdf.jpg4aa2724f61a24b9c9613ce9ad0e02418MD52unal/74993oai:repositorio.unal.edu.co:unal/749932023-07-06 23:05:18.692Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co