Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica

Diversos métodos estadísticos son aplicados a la investigación de redes complejas, por ejemplo en la construcción y comparación de redes de coexpresi´on génica (RCG). Las RCG muestran de forma gráficas cómo los genes de un ser vivo participan coordinadamente en los procesos celulares. Las RCG esquema...

Full description

Autores:
Leal Ayala, Luis Guillermo
Tipo de recurso:
Fecha de publicación:
2013
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/21850
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/21850
http://bdigital.unal.edu.co/12850/
Palabra clave:
51 Matemáticas / Mathematics
57 Ciencias de la vida; Biología / Life sciences; biology
Redes de coexpresión génica
Medidas de similitud
Información mutua
Umbral de similitud
Coeficientes de agrupamiento
Análisis en componentes principales
Clasificación no jerárquica
Comparación de redes
Inmunidad vegetal
Gene coexpression networks
Similarity measures
Mutual information
Similarity threshold
Clustering coefficient
Principal component analysis
Non-hierarchical classification
Network comparison
Plant immunity
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_1d887e034eec314831e3d2f239ad7838
oai_identifier_str oai:repositorio.unal.edu.co:unal/21850
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica
title Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica
spellingShingle Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica
51 Matemáticas / Mathematics
57 Ciencias de la vida; Biología / Life sciences; biology
Redes de coexpresión génica
Medidas de similitud
Información mutua
Umbral de similitud
Coeficientes de agrupamiento
Análisis en componentes principales
Clasificación no jerárquica
Comparación de redes
Inmunidad vegetal
Gene coexpression networks
Similarity measures
Mutual information
Similarity threshold
Clustering coefficient
Principal component analysis
Non-hierarchical classification
Network comparison
Plant immunity
title_short Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica
title_full Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica
title_fullStr Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica
title_full_unstemmed Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica
title_sort Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica
dc.creator.fl_str_mv Leal Ayala, Luis Guillermo
dc.contributor.advisor.spa.fl_str_mv López, Camilo (Thesis advisor)
dc.contributor.author.spa.fl_str_mv Leal Ayala, Luis Guillermo
dc.contributor.spa.fl_str_mv López Kleine, Liliana
dc.subject.ddc.spa.fl_str_mv 51 Matemáticas / Mathematics
57 Ciencias de la vida; Biología / Life sciences; biology
topic 51 Matemáticas / Mathematics
57 Ciencias de la vida; Biología / Life sciences; biology
Redes de coexpresión génica
Medidas de similitud
Información mutua
Umbral de similitud
Coeficientes de agrupamiento
Análisis en componentes principales
Clasificación no jerárquica
Comparación de redes
Inmunidad vegetal
Gene coexpression networks
Similarity measures
Mutual information
Similarity threshold
Clustering coefficient
Principal component analysis
Non-hierarchical classification
Network comparison
Plant immunity
dc.subject.proposal.spa.fl_str_mv Redes de coexpresión génica
Medidas de similitud
Información mutua
Umbral de similitud
Coeficientes de agrupamiento
Análisis en componentes principales
Clasificación no jerárquica
Comparación de redes
Inmunidad vegetal
Gene coexpression networks
Similarity measures
Mutual information
Similarity threshold
Clustering coefficient
Principal component analysis
Non-hierarchical classification
Network comparison
Plant immunity
description Diversos métodos estadísticos son aplicados a la investigación de redes complejas, por ejemplo en la construcción y comparación de redes de coexpresi´on génica (RCG). Las RCG muestran de forma gráficas cómo los genes de un ser vivo participan coordinadamente en los procesos celulares. Las RCG esquematizan el funcionamiento global del sistema biológico por medio de nodos (genes) y aristas (relaciones funcionales entre genes), con base en datos experimentales. En este trabajo se identifican varias limitaciones previa- mente reportadas en las metodologías de construcción y comparación de RCG. Se evalúan y seleccionan los métodos más indicados para mejorar desde un enfoque estadístico las estrategias empleadas actualmente. La tesis hace los siguientes aportes: • En la construcción de RCG: – Se emplea una medida de similitud que considera las asociaciones no lineales entre los datos de expresión. – Se adapta un método basado en coeficientes de agrupamiento para establecer las aristas de la red. • En la comparación de RCG: – Se proponen nuevas variables capaces de capturar información topológica y biológica intrínseca en la red. – Se comparan las redes aplicando un análisis en componentes principales seguido de una clasificación no jerárquica. La metodología se evaluó con datos obtenidos en experimentos de inmunidad en las plantas: arroz, soya, tomate, yuca y Arabidopsis. Los resultados demuestran que las RCG construidas con esta metodología contienen aristas valiosas para entender el sistema. Se encontró una forma objetiva y confiable de construir la red, con la cual se reduce el ruido de los datos y se evitan aristas no significativas. Con el objetivo de caracterizar las redes, se demostró que las nuevas variables son independientes del tamaño de la red y aportan información valiosa para comprender los sistemas en estudio. Finalmente, al hacer la clasificación de las redes en el espacio factorial, se encontraron patrones de similitud entre las redes, al igual que asociaciones entre las variables que las describían.
publishDate 2013
dc.date.issued.spa.fl_str_mv 2013-11
dc.date.accessioned.spa.fl_str_mv 2019-06-25T19:54:38Z
dc.date.available.spa.fl_str_mv 2019-06-25T19:54:38Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/21850
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/12850/
url https://repositorio.unal.edu.co/handle/unal/21850
http://bdigital.unal.edu.co/12850/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de Estadística
Departamento de Estadística
dc.relation.references.spa.fl_str_mv Leal Ayala, Luis Guillermo (2013) Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica. Maestría thesis, Universidad Nacional de Colombia.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/21850/1/832624.2013.pdf
https://repositorio.unal.edu.co/bitstream/unal/21850/2/832624.2013.pdf.jpg
bitstream.checksum.fl_str_mv e8dc49ea9a90a80a64483250ca0ffca6
62e6968ca67c23f1bc34e3c764ba608c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814090102860677120
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2López Kleine, LilianaLópez, Camilo (Thesis advisor)51fe5c56-7c1a-491f-b0bf-796ca02c8a26-1Leal Ayala, Luis Guillermoe2c0a26d-04d1-4f29-86a3-da905894ef8e3002019-06-25T19:54:38Z2019-06-25T19:54:38Z2013-11https://repositorio.unal.edu.co/handle/unal/21850http://bdigital.unal.edu.co/12850/Diversos métodos estadísticos son aplicados a la investigación de redes complejas, por ejemplo en la construcción y comparación de redes de coexpresi´on génica (RCG). Las RCG muestran de forma gráficas cómo los genes de un ser vivo participan coordinadamente en los procesos celulares. Las RCG esquematizan el funcionamiento global del sistema biológico por medio de nodos (genes) y aristas (relaciones funcionales entre genes), con base en datos experimentales. En este trabajo se identifican varias limitaciones previa- mente reportadas en las metodologías de construcción y comparación de RCG. Se evalúan y seleccionan los métodos más indicados para mejorar desde un enfoque estadístico las estrategias empleadas actualmente. La tesis hace los siguientes aportes: • En la construcción de RCG: – Se emplea una medida de similitud que considera las asociaciones no lineales entre los datos de expresión. – Se adapta un método basado en coeficientes de agrupamiento para establecer las aristas de la red. • En la comparación de RCG: – Se proponen nuevas variables capaces de capturar información topológica y biológica intrínseca en la red. – Se comparan las redes aplicando un análisis en componentes principales seguido de una clasificación no jerárquica. La metodología se evaluó con datos obtenidos en experimentos de inmunidad en las plantas: arroz, soya, tomate, yuca y Arabidopsis. Los resultados demuestran que las RCG construidas con esta metodología contienen aristas valiosas para entender el sistema. Se encontró una forma objetiva y confiable de construir la red, con la cual se reduce el ruido de los datos y se evitan aristas no significativas. Con el objetivo de caracterizar las redes, se demostró que las nuevas variables son independientes del tamaño de la red y aportan información valiosa para comprender los sistemas en estudio. Finalmente, al hacer la clasificación de las redes en el espacio factorial, se encontraron patrones de similitud entre las redes, al igual que asociaciones entre las variables que las describían.Abstract: Statistical methods are used in scientific research to study complex networks such as gene coexpression networks (GCNs). These networks show how genes take part of cellular processes coordinately. GCNs depict the biological systems by means of nodes (genes) and edges (functional relationships between genes), based on experimental data. In this work, some shortcomings of current methodologies for construction and comparison of GCNs are studied. Several methods were evaluated and the most suitable were selec- ted to propose a novel enhanced statistical methodology. This thesis makes the following contributions: • To the construction of GCNs: – A similarity measure that takes into account nonlinear relationships on data is used. – A novel method based on clustering coefficients was adapted with the aim of defining the network’s edges. • To the comparison of GCNs: – New variables that summarize topological and biological information of the GCNs were proposed. – A principal component analysis and the non-hierarchical classification method of K-Means were applied with the aim of studying the GCNs based on multi- variate analyses. This methodology was applied using gene expression data that were obtained from immunity experiments of the plants: rice, soybean, tomato, cassava and Arabidopsis. The results show that many important edges were included in GCNs, but also the noise of data was reduced to avoid non-significant edges. The variables used to characterize GCNs are nondependent on networks’ size and revealed new information to understand the biological system. Finally, the GCNs classification on the principal component’s space, allowed the finding of similar networks and of dependences among variables.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de EstadísticaDepartamento de EstadísticaLeal Ayala, Luis Guillermo (2013) Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica. Maestría thesis, Universidad Nacional de Colombia.51 Matemáticas / Mathematics57 Ciencias de la vida; Biología / Life sciences; biologyRedes de coexpresión génicaMedidas de similitudInformación mutuaUmbral de similitudCoeficientes de agrupamientoAnálisis en componentes principalesClasificación no jerárquicaComparación de redesInmunidad vegetalGene coexpression networksSimilarity measuresMutual informationSimilarity thresholdClustering coefficientPrincipal component analysisNon-hierarchical classificationNetwork comparisonPlant immunityDesarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génicaTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL832624.2013.pdfapplication/pdf8303060https://repositorio.unal.edu.co/bitstream/unal/21850/1/832624.2013.pdfe8dc49ea9a90a80a64483250ca0ffca6MD51THUMBNAIL832624.2013.pdf.jpg832624.2013.pdf.jpgGenerated Thumbnailimage/jpeg4182https://repositorio.unal.edu.co/bitstream/unal/21850/2/832624.2013.pdf.jpg62e6968ca67c23f1bc34e3c764ba608cMD52unal/21850oai:repositorio.unal.edu.co:unal/218502022-12-06 18:38:44.099Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co