Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica
Diversos métodos estadísticos son aplicados a la investigación de redes complejas, por ejemplo en la construcción y comparación de redes de coexpresi´on génica (RCG). Las RCG muestran de forma gráficas cómo los genes de un ser vivo participan coordinadamente en los procesos celulares. Las RCG esquema...
- Autores:
-
Leal Ayala, Luis Guillermo
- Tipo de recurso:
- Fecha de publicación:
- 2013
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/21850
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/21850
http://bdigital.unal.edu.co/12850/
- Palabra clave:
- 51 Matemáticas / Mathematics
57 Ciencias de la vida; Biología / Life sciences; biology
Redes de coexpresión génica
Medidas de similitud
Información mutua
Umbral de similitud
Coeficientes de agrupamiento
Análisis en componentes principales
Clasificación no jerárquica
Comparación de redes
Inmunidad vegetal
Gene coexpression networks
Similarity measures
Mutual information
Similarity threshold
Clustering coefficient
Principal component analysis
Non-hierarchical classification
Network comparison
Plant immunity
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_1d887e034eec314831e3d2f239ad7838 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/21850 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica |
title |
Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica |
spellingShingle |
Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica 51 Matemáticas / Mathematics 57 Ciencias de la vida; Biología / Life sciences; biology Redes de coexpresión génica Medidas de similitud Información mutua Umbral de similitud Coeficientes de agrupamiento Análisis en componentes principales Clasificación no jerárquica Comparación de redes Inmunidad vegetal Gene coexpression networks Similarity measures Mutual information Similarity threshold Clustering coefficient Principal component analysis Non-hierarchical classification Network comparison Plant immunity |
title_short |
Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica |
title_full |
Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica |
title_fullStr |
Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica |
title_full_unstemmed |
Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica |
title_sort |
Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica |
dc.creator.fl_str_mv |
Leal Ayala, Luis Guillermo |
dc.contributor.advisor.spa.fl_str_mv |
López, Camilo (Thesis advisor) |
dc.contributor.author.spa.fl_str_mv |
Leal Ayala, Luis Guillermo |
dc.contributor.spa.fl_str_mv |
López Kleine, Liliana |
dc.subject.ddc.spa.fl_str_mv |
51 Matemáticas / Mathematics 57 Ciencias de la vida; Biología / Life sciences; biology |
topic |
51 Matemáticas / Mathematics 57 Ciencias de la vida; Biología / Life sciences; biology Redes de coexpresión génica Medidas de similitud Información mutua Umbral de similitud Coeficientes de agrupamiento Análisis en componentes principales Clasificación no jerárquica Comparación de redes Inmunidad vegetal Gene coexpression networks Similarity measures Mutual information Similarity threshold Clustering coefficient Principal component analysis Non-hierarchical classification Network comparison Plant immunity |
dc.subject.proposal.spa.fl_str_mv |
Redes de coexpresión génica Medidas de similitud Información mutua Umbral de similitud Coeficientes de agrupamiento Análisis en componentes principales Clasificación no jerárquica Comparación de redes Inmunidad vegetal Gene coexpression networks Similarity measures Mutual information Similarity threshold Clustering coefficient Principal component analysis Non-hierarchical classification Network comparison Plant immunity |
description |
Diversos métodos estadísticos son aplicados a la investigación de redes complejas, por ejemplo en la construcción y comparación de redes de coexpresi´on génica (RCG). Las RCG muestran de forma gráficas cómo los genes de un ser vivo participan coordinadamente en los procesos celulares. Las RCG esquematizan el funcionamiento global del sistema biológico por medio de nodos (genes) y aristas (relaciones funcionales entre genes), con base en datos experimentales. En este trabajo se identifican varias limitaciones previa- mente reportadas en las metodologías de construcción y comparación de RCG. Se evalúan y seleccionan los métodos más indicados para mejorar desde un enfoque estadístico las estrategias empleadas actualmente. La tesis hace los siguientes aportes: • En la construcción de RCG: – Se emplea una medida de similitud que considera las asociaciones no lineales entre los datos de expresión. – Se adapta un método basado en coeficientes de agrupamiento para establecer las aristas de la red. • En la comparación de RCG: – Se proponen nuevas variables capaces de capturar información topológica y biológica intrínseca en la red. – Se comparan las redes aplicando un análisis en componentes principales seguido de una clasificación no jerárquica. La metodología se evaluó con datos obtenidos en experimentos de inmunidad en las plantas: arroz, soya, tomate, yuca y Arabidopsis. Los resultados demuestran que las RCG construidas con esta metodología contienen aristas valiosas para entender el sistema. Se encontró una forma objetiva y confiable de construir la red, con la cual se reduce el ruido de los datos y se evitan aristas no significativas. Con el objetivo de caracterizar las redes, se demostró que las nuevas variables son independientes del tamaño de la red y aportan información valiosa para comprender los sistemas en estudio. Finalmente, al hacer la clasificación de las redes en el espacio factorial, se encontraron patrones de similitud entre las redes, al igual que asociaciones entre las variables que las describían. |
publishDate |
2013 |
dc.date.issued.spa.fl_str_mv |
2013-11 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-25T19:54:38Z |
dc.date.available.spa.fl_str_mv |
2019-06-25T19:54:38Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/21850 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/12850/ |
url |
https://repositorio.unal.edu.co/handle/unal/21850 http://bdigital.unal.edu.co/12850/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de Estadística Departamento de Estadística |
dc.relation.references.spa.fl_str_mv |
Leal Ayala, Luis Guillermo (2013) Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica. Maestría thesis, Universidad Nacional de Colombia. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/21850/1/832624.2013.pdf https://repositorio.unal.edu.co/bitstream/unal/21850/2/832624.2013.pdf.jpg |
bitstream.checksum.fl_str_mv |
e8dc49ea9a90a80a64483250ca0ffca6 62e6968ca67c23f1bc34e3c764ba608c |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814090102860677120 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2López Kleine, LilianaLópez, Camilo (Thesis advisor)51fe5c56-7c1a-491f-b0bf-796ca02c8a26-1Leal Ayala, Luis Guillermoe2c0a26d-04d1-4f29-86a3-da905894ef8e3002019-06-25T19:54:38Z2019-06-25T19:54:38Z2013-11https://repositorio.unal.edu.co/handle/unal/21850http://bdigital.unal.edu.co/12850/Diversos métodos estadísticos son aplicados a la investigación de redes complejas, por ejemplo en la construcción y comparación de redes de coexpresi´on génica (RCG). Las RCG muestran de forma gráficas cómo los genes de un ser vivo participan coordinadamente en los procesos celulares. Las RCG esquematizan el funcionamiento global del sistema biológico por medio de nodos (genes) y aristas (relaciones funcionales entre genes), con base en datos experimentales. En este trabajo se identifican varias limitaciones previa- mente reportadas en las metodologías de construcción y comparación de RCG. Se evalúan y seleccionan los métodos más indicados para mejorar desde un enfoque estadístico las estrategias empleadas actualmente. La tesis hace los siguientes aportes: • En la construcción de RCG: – Se emplea una medida de similitud que considera las asociaciones no lineales entre los datos de expresión. – Se adapta un método basado en coeficientes de agrupamiento para establecer las aristas de la red. • En la comparación de RCG: – Se proponen nuevas variables capaces de capturar información topológica y biológica intrínseca en la red. – Se comparan las redes aplicando un análisis en componentes principales seguido de una clasificación no jerárquica. La metodología se evaluó con datos obtenidos en experimentos de inmunidad en las plantas: arroz, soya, tomate, yuca y Arabidopsis. Los resultados demuestran que las RCG construidas con esta metodología contienen aristas valiosas para entender el sistema. Se encontró una forma objetiva y confiable de construir la red, con la cual se reduce el ruido de los datos y se evitan aristas no significativas. Con el objetivo de caracterizar las redes, se demostró que las nuevas variables son independientes del tamaño de la red y aportan información valiosa para comprender los sistemas en estudio. Finalmente, al hacer la clasificación de las redes en el espacio factorial, se encontraron patrones de similitud entre las redes, al igual que asociaciones entre las variables que las describían.Abstract: Statistical methods are used in scientific research to study complex networks such as gene coexpression networks (GCNs). These networks show how genes take part of cellular processes coordinately. GCNs depict the biological systems by means of nodes (genes) and edges (functional relationships between genes), based on experimental data. In this work, some shortcomings of current methodologies for construction and comparison of GCNs are studied. Several methods were evaluated and the most suitable were selec- ted to propose a novel enhanced statistical methodology. This thesis makes the following contributions: • To the construction of GCNs: – A similarity measure that takes into account nonlinear relationships on data is used. – A novel method based on clustering coefficients was adapted with the aim of defining the network’s edges. • To the comparison of GCNs: – New variables that summarize topological and biological information of the GCNs were proposed. – A principal component analysis and the non-hierarchical classification method of K-Means were applied with the aim of studying the GCNs based on multi- variate analyses. This methodology was applied using gene expression data that were obtained from immunity experiments of the plants: rice, soybean, tomato, cassava and Arabidopsis. The results show that many important edges were included in GCNs, but also the noise of data was reduced to avoid non-significant edges. The variables used to characterize GCNs are nondependent on networks’ size and revealed new information to understand the biological system. Finally, the GCNs classification on the principal component’s space, allowed the finding of similar networks and of dependences among variables.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de EstadísticaDepartamento de EstadísticaLeal Ayala, Luis Guillermo (2013) Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica. Maestría thesis, Universidad Nacional de Colombia.51 Matemáticas / Mathematics57 Ciencias de la vida; Biología / Life sciences; biologyRedes de coexpresión génicaMedidas de similitudInformación mutuaUmbral de similitudCoeficientes de agrupamientoAnálisis en componentes principalesClasificación no jerárquicaComparación de redesInmunidad vegetalGene coexpression networksSimilarity measuresMutual informationSimilarity thresholdClustering coefficientPrincipal component analysisNon-hierarchical classificationNetwork comparisonPlant immunityDesarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génicaTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL832624.2013.pdfapplication/pdf8303060https://repositorio.unal.edu.co/bitstream/unal/21850/1/832624.2013.pdfe8dc49ea9a90a80a64483250ca0ffca6MD51THUMBNAIL832624.2013.pdf.jpg832624.2013.pdf.jpgGenerated Thumbnailimage/jpeg4182https://repositorio.unal.edu.co/bitstream/unal/21850/2/832624.2013.pdf.jpg62e6968ca67c23f1bc34e3c764ba608cMD52unal/21850oai:repositorio.unal.edu.co:unal/218502022-12-06 18:38:44.099Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |