Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento
La producción actual a gran escala y a bajo costo de secuencias han permitido el auge de las aproximaciones metagenómicas para explorar la información genómica almacenada en los diversos ecosistemas del planeta. Esto brinda la oportunidad de experimentar nuevas metodologías para el mapeo de genes fu...
- Autores:
-
Torres Estupiñan, Guillermo Gonzalo
- Tipo de recurso:
- Fecha de publicación:
- 2014
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/74993
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/74993
http://bdigital.unal.edu.co/39485/
- Palabra clave:
- 55 Ciencias de la tierra / Earth sciences and geology
57 Ciencias de la vida; Biología / Life sciences; biology
Asignación por similitud
Ciclos biogeoquímicos
Diseño de sondas
Homology binning
Biogechemestry cycles
Probe design
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_22ff1e68f454eecead12a3d99fccd4a7 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/74993 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento |
title |
Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento |
spellingShingle |
Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento 55 Ciencias de la tierra / Earth sciences and geology 57 Ciencias de la vida; Biología / Life sciences; biology Asignación por similitud Ciclos biogeoquímicos Diseño de sondas Homology binning Biogechemestry cycles Probe design |
title_short |
Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento |
title_full |
Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento |
title_fullStr |
Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento |
title_full_unstemmed |
Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento |
title_sort |
Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento |
dc.creator.fl_str_mv |
Torres Estupiñan, Guillermo Gonzalo |
dc.contributor.author.spa.fl_str_mv |
Torres Estupiñan, Guillermo Gonzalo |
dc.contributor.spa.fl_str_mv |
Barreto Hernández, Emiliano |
dc.subject.ddc.spa.fl_str_mv |
55 Ciencias de la tierra / Earth sciences and geology 57 Ciencias de la vida; Biología / Life sciences; biology |
topic |
55 Ciencias de la tierra / Earth sciences and geology 57 Ciencias de la vida; Biología / Life sciences; biology Asignación por similitud Ciclos biogeoquímicos Diseño de sondas Homology binning Biogechemestry cycles Probe design |
dc.subject.proposal.spa.fl_str_mv |
Asignación por similitud Ciclos biogeoquímicos Diseño de sondas Homology binning Biogechemestry cycles Probe design |
description |
La producción actual a gran escala y a bajo costo de secuencias han permitido el auge de las aproximaciones metagenómicas para explorar la información genómica almacenada en los diversos ecosistemas del planeta. Esto brinda la oportunidad de experimentar nuevas metodologías para el mapeo de genes funcionales, de manera que se pueda estimar la capacidad funcional inherente de las comunidades microbianas. El Sistema de Hibridación In silico es una aproximación de clasificación taxonómica y funcional que implementa dos flujos de trabajo; un Creador de Sondas (CrSo) encargado de diseñar sondas a nivel taxonómico de genero a partir de las secuencias introducidas y un Hibridador In Silico Secuencial (HISS), que se encarga de hacer el proceso de hibridación entre las sondas generadas con las secuencias de la comunidad. El sistema de Hibridación In silico caracteriza comunidades edáficas evaluando el potencial funcional diferencial de los ciclos biogeoquímicos del Nitrógeno y el Fosforo, para lo cual se identificaron 73 reacciones claves que contaban con 63 familias enzimáticas y 47.419 secuencias nucleotídicas de las enzimas correspondientes a dichas familias. A partir de las secuencias nucleotídicas se diseñaron sondas con CrSo, para un total de 41.430 sondas divididas en 5 grupos de longitudes 25pb, 40pb, 60pb, 80pb y 100pb. A partir de las sondas diseñadas con CrSo y datos simulados de secuenciamiento con características de la plataforma illumina, se determinaron las condiciones de hibridación de HISS, las cuales consideraron como límite inferior de longitud de alineamiento 35pb para y un relación malos apareamientos - longitud de alineamiento descrita por la función logarítmica: !!=!9,6413!ln!!! −!30,483. Con esto se aseguró una sensibilidad y especificidad promedio de 85% y 95% respectivamente, para sondas de longitud 100pb. Bajo la previa parametrización de HISS, se determinó que la mejor forma de caracterizar una comunidad era utilizando la sonda de 100pb con mayor puntaje de especificidad, calculado por CrSo. Adicionalmente, bajo estas condiciones la sobre o sub estimación de genes de la población a muestrear es mínimo. La caracterización de una muestra edáfica real a través del sistema de Hibridación in silico permitió diferenciar claramente el potencial funcional del ecosistema, de su metabolismo activo, tanto desde el punto de vista génico y enzimático como también desde su componente organísmico. Este trabajo presenta una nueva aproximación de clasificación taxonómica y funcional de comunidades microbianas basada en una estrategia de similitud que no requiere un previo ensamblaje de secuencias. Dicha aproximación difiere del enfoque comúnmente utilizado, en que usa huellas genéticas (sondas) diseñadas para cada gen de interés y evalúa las características de los alineamientos que ellas obtienen con las secuencias de la comunidad en estudio. |
publishDate |
2014 |
dc.date.issued.spa.fl_str_mv |
2014 |
dc.date.accessioned.spa.fl_str_mv |
2019-07-03T18:51:15Z |
dc.date.available.spa.fl_str_mv |
2019-07-03T18:51:15Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/74993 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/39485/ |
url |
https://repositorio.unal.edu.co/handle/unal/74993 http://bdigital.unal.edu.co/39485/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de Biología Departamento de Biología |
dc.relation.references.spa.fl_str_mv |
Torres Estupiñan, Guillermo Gonzalo (2014) Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento. Maestría thesis, Universidad Nacional de Colombia. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/74993/1/guillermotorrese.2014.pdf https://repositorio.unal.edu.co/bitstream/unal/74993/2/guillermotorrese.2014.pdf.jpg |
bitstream.checksum.fl_str_mv |
cf5d717f4e1376312bd4aada2c280c47 4aa2724f61a24b9c9613ce9ad0e02418 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089884178055168 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Barreto Hernández, EmilianoTorres Estupiñan, Guillermo Gonzalo625bb2a4-6cb1-4581-9c21-16904d330f333002019-07-03T18:51:15Z2019-07-03T18:51:15Z2014https://repositorio.unal.edu.co/handle/unal/74993http://bdigital.unal.edu.co/39485/La producción actual a gran escala y a bajo costo de secuencias han permitido el auge de las aproximaciones metagenómicas para explorar la información genómica almacenada en los diversos ecosistemas del planeta. Esto brinda la oportunidad de experimentar nuevas metodologías para el mapeo de genes funcionales, de manera que se pueda estimar la capacidad funcional inherente de las comunidades microbianas. El Sistema de Hibridación In silico es una aproximación de clasificación taxonómica y funcional que implementa dos flujos de trabajo; un Creador de Sondas (CrSo) encargado de diseñar sondas a nivel taxonómico de genero a partir de las secuencias introducidas y un Hibridador In Silico Secuencial (HISS), que se encarga de hacer el proceso de hibridación entre las sondas generadas con las secuencias de la comunidad. El sistema de Hibridación In silico caracteriza comunidades edáficas evaluando el potencial funcional diferencial de los ciclos biogeoquímicos del Nitrógeno y el Fosforo, para lo cual se identificaron 73 reacciones claves que contaban con 63 familias enzimáticas y 47.419 secuencias nucleotídicas de las enzimas correspondientes a dichas familias. A partir de las secuencias nucleotídicas se diseñaron sondas con CrSo, para un total de 41.430 sondas divididas en 5 grupos de longitudes 25pb, 40pb, 60pb, 80pb y 100pb. A partir de las sondas diseñadas con CrSo y datos simulados de secuenciamiento con características de la plataforma illumina, se determinaron las condiciones de hibridación de HISS, las cuales consideraron como límite inferior de longitud de alineamiento 35pb para y un relación malos apareamientos - longitud de alineamiento descrita por la función logarítmica: !!=!9,6413!ln!!! −!30,483. Con esto se aseguró una sensibilidad y especificidad promedio de 85% y 95% respectivamente, para sondas de longitud 100pb. Bajo la previa parametrización de HISS, se determinó que la mejor forma de caracterizar una comunidad era utilizando la sonda de 100pb con mayor puntaje de especificidad, calculado por CrSo. Adicionalmente, bajo estas condiciones la sobre o sub estimación de genes de la población a muestrear es mínimo. La caracterización de una muestra edáfica real a través del sistema de Hibridación in silico permitió diferenciar claramente el potencial funcional del ecosistema, de su metabolismo activo, tanto desde el punto de vista génico y enzimático como también desde su componente organísmico. Este trabajo presenta una nueva aproximación de clasificación taxonómica y funcional de comunidades microbianas basada en una estrategia de similitud que no requiere un previo ensamblaje de secuencias. Dicha aproximación difiere del enfoque comúnmente utilizado, en que usa huellas genéticas (sondas) diseñadas para cada gen de interés y evalúa las características de los alineamientos que ellas obtienen con las secuencias de la comunidad en estudio.Abstract. Nowadays the widely production and low cost of sequencing has allowed the extent of metagenomics in order to explore the genomic information from diverse environments. This offers the opportunity to examine new approaches for the sequence binning and functional assignment. The In silico Hybridization System is an approach of functional assignment and gender taxonomic level binning working with two general pipelines: Probes Creator (CrSo) ordered to design DNA fingerprints to a gender taxonomic level, this probes will be used by the Sequential In silico Hybridator (HISS) to make the hybridization with the community reads. The In silico Hybridization System assesses the edaphic differential functional potential of Nitrogen and Phosphorus biochemical cycles, to do that, 73 key reactions with 63 enzyme families and 47.419 nucleotide sequences of them were identified. From those nucleotide sequences, CrSo design 41.430 probes. These probes make up 5 probe length groups, as follows: 25pb, 40pb, 60pb, 80pb and 100pb. The HISS hibridization conditions were set up with the probes designed by CrSo and likeillumina simulated reads. Therefore, was defined the alignment lenght threshold, in 35pb, and a relation between alignment lenght and mismatch described by a logarithmic function: !!=!9,6413!ln!!! −!30,483. With these parameters, HISS ensured a mean sensibility and specificity of 85% and 95% respectively for 100pb pobres length. Under these HISS parameteres, it was determined that the best way to characterize edaphic communities was with a the best CrSo specificity score of 100pb probe length, without gene under or sub estimates. The characterization of real edaphic sample through In silico Hybridization System, allowed clearly distinguish between the ecosistem’s functional potential of its active metabolism, since its genetic, enzymatic and organismic perspectives This work presents a new functional and taxonomical binning approach of microbial communities, it is based on homology strategy that do not require read assembling. This approach uses fingerprints (probes) for each gene target and assess the alignments homology characteristics of hibridization between probes and metagenome reads.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de BiologíaDepartamento de BiologíaTorres Estupiñan, Guillermo Gonzalo (2014) Diseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimiento. Maestría thesis, Universidad Nacional de Colombia.55 Ciencias de la tierra / Earth sciences and geology57 Ciencias de la vida; Biología / Life sciences; biologyAsignación por similitudCiclos biogeoquímicosDiseño de sondasHomology binningBiogechemestry cyclesProbe designDiseño de un sistema de hibridación in Silico para el mapeo de genes funcionales de la comunidad microbiana del suelo a partir de datos provenientes de técnicas de secuenciación de alto rendimientoTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINALguillermotorrese.2014.pdfapplication/pdf4518213https://repositorio.unal.edu.co/bitstream/unal/74993/1/guillermotorrese.2014.pdfcf5d717f4e1376312bd4aada2c280c47MD51THUMBNAILguillermotorrese.2014.pdf.jpgguillermotorrese.2014.pdf.jpgGenerated Thumbnailimage/jpeg5932https://repositorio.unal.edu.co/bitstream/unal/74993/2/guillermotorrese.2014.pdf.jpg4aa2724f61a24b9c9613ce9ad0e02418MD52unal/74993oai:repositorio.unal.edu.co:unal/749932023-07-06 23:05:18.692Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |