Aplicación del análisis de rango reescalado r/s para la predicción de genes en el genoma vegetal
La predicción de genes es en la actualidad uno de los principales desafíos de la genómica. La predicción permite realizar experimentos con alta probabilidad de encontrar genes de interés y comparar regiones de ADN de importancia agronómica entre genomas; además, ayuda a restringir los espacios de bú...
- Autores:
-
Almanza Pinzón, Martha Isabel
López López, Karina
Téllez Villa, Carlos Eduardo
- Tipo de recurso:
- Article of journal
- Fecha de publicación:
- 2010
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/33233
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/33233
http://bdigital.unal.edu.co/23313/
- Palabra clave:
- 6 Tecnología (ciencias aplicadas) / Technology
63 Agricultura y tecnologías relacionadas / Agriculture
Genómica comparativa
predicción de genes
análisis R/S
coeficiente de Hurst
Arabidopsis thaliana
Oryza sativa
Mus musculus.
Comparative genomics
gene’s prediction
R/S analysis
Hurst coefficient
Arabidopsis thaliana
Oryza sativa
Mus musculus.
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_494d9081551ab3d5c60ad32846784861 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/33233 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Aplicación del análisis de rango reescalado r/s para la predicción de genes en el genoma vegetal |
title |
Aplicación del análisis de rango reescalado r/s para la predicción de genes en el genoma vegetal |
spellingShingle |
Aplicación del análisis de rango reescalado r/s para la predicción de genes en el genoma vegetal 6 Tecnología (ciencias aplicadas) / Technology 63 Agricultura y tecnologías relacionadas / Agriculture Genómica comparativa predicción de genes análisis R/S coeficiente de Hurst Arabidopsis thaliana Oryza sativa Mus musculus. Comparative genomics gene’s prediction R/S analysis Hurst coefficient Arabidopsis thaliana Oryza sativa Mus musculus. |
title_short |
Aplicación del análisis de rango reescalado r/s para la predicción de genes en el genoma vegetal |
title_full |
Aplicación del análisis de rango reescalado r/s para la predicción de genes en el genoma vegetal |
title_fullStr |
Aplicación del análisis de rango reescalado r/s para la predicción de genes en el genoma vegetal |
title_full_unstemmed |
Aplicación del análisis de rango reescalado r/s para la predicción de genes en el genoma vegetal |
title_sort |
Aplicación del análisis de rango reescalado r/s para la predicción de genes en el genoma vegetal |
dc.creator.fl_str_mv |
Almanza Pinzón, Martha Isabel López López, Karina Téllez Villa, Carlos Eduardo |
dc.contributor.author.spa.fl_str_mv |
Almanza Pinzón, Martha Isabel López López, Karina Téllez Villa, Carlos Eduardo |
dc.subject.ddc.spa.fl_str_mv |
6 Tecnología (ciencias aplicadas) / Technology 63 Agricultura y tecnologías relacionadas / Agriculture |
topic |
6 Tecnología (ciencias aplicadas) / Technology 63 Agricultura y tecnologías relacionadas / Agriculture Genómica comparativa predicción de genes análisis R/S coeficiente de Hurst Arabidopsis thaliana Oryza sativa Mus musculus. Comparative genomics gene’s prediction R/S analysis Hurst coefficient Arabidopsis thaliana Oryza sativa Mus musculus. |
dc.subject.proposal.spa.fl_str_mv |
Genómica comparativa predicción de genes análisis R/S coeficiente de Hurst Arabidopsis thaliana Oryza sativa Mus musculus. Comparative genomics gene’s prediction R/S analysis Hurst coefficient Arabidopsis thaliana Oryza sativa Mus musculus. |
description |
La predicción de genes es en la actualidad uno de los principales desafíos de la genómica. La predicción permite realizar experimentos con alta probabilidad de encontrar genes de interés y comparar regiones de ADN de importancia agronómica entre genomas; además, ayuda a restringir los espacios de búsqueda en las bases de datos. Un procedimiento estadístico con base en el análisis R/S y el coeficiente de Hurst fue desarrollado para caracterizar y predecir genes y los componentes estructurales de estos (exones e intrones) en los genomas eucariotas completos de Arabidopsis thaliana, Oriza sativa y Mus musculus. Algoritmos en lenguaje de programación Python fueron desarrollados para extraer, filtrar y modelar más del 80% de las secuencias de genes registradas para estos genomas en la base de datos del GeneBank del NCBI. El análisis R/S permitió demostrar que existe un orden estructural en la distribución de los nucleótidos que constituyen las secuencias en las que predominan los fenómenos de memoria o dependencia de largo alcance. La estructura de memoria varía según el tipo de secuencias y el genoma de la especie. Las secuencias de los genes y exones de los genomas vegetales analizados presentaron comportamiento persistente mientras que las de los intrones tuvieron un comportamiento antipersistente, en comparación, al genoma animal en el cual los tres tipos de secuencias presentaron comportamiento persistente. De acuerdo con los parámetros provenientes del análisis R/S, el patrón de distribución de las secuencias del genoma se repitió de manera estadísticamente similar en cada uno de los cromosomas que pertenecen a una especie, constituyéndose en evidencias fundamentales de invarianza por cambio de escala; es decir, cada cromosoma por sí solo es una réplica estadística a menor escala del genoma completo. Los parámetros constituyeron criterios compactos para derivar predictores (clasificadores) de secuencias que alcanzaron promedios de sensibilidad y especificidad mayor del 81% y 70%, respectivamente. Este procedimiento podría ser probado en otros genomas y utilizado como criterio para incrementar la eficiencia de la selección en los programas de mejoramiento genético vegetal. |
publishDate |
2010 |
dc.date.issued.spa.fl_str_mv |
2010-10-01 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-27T22:54:39Z |
dc.date.available.spa.fl_str_mv |
2019-06-27T22:54:39Z |
dc.type.spa.fl_str_mv |
Artículo de revista |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_2df8fbb1 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/article |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_6501 |
dc.type.coarversion.spa.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/ART |
format |
http://purl.org/coar/resource_type/c_6501 |
status_str |
publishedVersion |
dc.identifier.issn.spa.fl_str_mv |
ISSN: 2323-0118 |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/33233 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/23313/ |
identifier_str_mv |
ISSN: 2323-0118 |
url |
https://repositorio.unal.edu.co/handle/unal/33233 http://bdigital.unal.edu.co/23313/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.spa.fl_str_mv |
http://revistas.unal.edu.co/index.php/acta_agronomica/article/view/20132 |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Revistas electrónicas UN Acta Agronómica Acta Agronómica |
dc.relation.references.spa.fl_str_mv |
Almanza Pinzón, Martha Isabel and López López, Karina and Téllez Villa, Carlos Eduardo (2010) Aplicación del análisis de rango reescalado r/s para la predicción de genes en el genoma vegetal. Acta Agronómica, 59 (4). pp. 473-487. ISSN 2323-0118 |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/msword |
dc.publisher.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Palmira |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/33233/1/20132-67525-1-PB.doc https://repositorio.unal.edu.co/bitstream/unal/33233/2/20132-67526-1-PB.pdf https://repositorio.unal.edu.co/bitstream/unal/33233/3/20132-67526-1-PB.pdf.jpg |
bitstream.checksum.fl_str_mv |
4a2e5793ca268c2a2361e1e5ca1d4336 15fc2e8c7a8bc91ac25a33617249426a cb85f3f0c51bbfb3d097b314ef9b6623 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089995952062464 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Almanza Pinzón, Martha Isabeldf987146-cdb5-41d6-ae93-fc465ab050a0300López López, Karina10ea2531-541d-4147-90d5-9fc4ea230a35300Téllez Villa, Carlos Eduardoc2b28704-6316-46ba-bb14-c08c454a79ac3002019-06-27T22:54:39Z2019-06-27T22:54:39Z2010-10-01ISSN: 2323-0118https://repositorio.unal.edu.co/handle/unal/33233http://bdigital.unal.edu.co/23313/La predicción de genes es en la actualidad uno de los principales desafíos de la genómica. La predicción permite realizar experimentos con alta probabilidad de encontrar genes de interés y comparar regiones de ADN de importancia agronómica entre genomas; además, ayuda a restringir los espacios de búsqueda en las bases de datos. Un procedimiento estadístico con base en el análisis R/S y el coeficiente de Hurst fue desarrollado para caracterizar y predecir genes y los componentes estructurales de estos (exones e intrones) en los genomas eucariotas completos de Arabidopsis thaliana, Oriza sativa y Mus musculus. Algoritmos en lenguaje de programación Python fueron desarrollados para extraer, filtrar y modelar más del 80% de las secuencias de genes registradas para estos genomas en la base de datos del GeneBank del NCBI. El análisis R/S permitió demostrar que existe un orden estructural en la distribución de los nucleótidos que constituyen las secuencias en las que predominan los fenómenos de memoria o dependencia de largo alcance. La estructura de memoria varía según el tipo de secuencias y el genoma de la especie. Las secuencias de los genes y exones de los genomas vegetales analizados presentaron comportamiento persistente mientras que las de los intrones tuvieron un comportamiento antipersistente, en comparación, al genoma animal en el cual los tres tipos de secuencias presentaron comportamiento persistente. De acuerdo con los parámetros provenientes del análisis R/S, el patrón de distribución de las secuencias del genoma se repitió de manera estadísticamente similar en cada uno de los cromosomas que pertenecen a una especie, constituyéndose en evidencias fundamentales de invarianza por cambio de escala; es decir, cada cromosoma por sí solo es una réplica estadística a menor escala del genoma completo. Los parámetros constituyeron criterios compactos para derivar predictores (clasificadores) de secuencias que alcanzaron promedios de sensibilidad y especificidad mayor del 81% y 70%, respectivamente. Este procedimiento podría ser probado en otros genomas y utilizado como criterio para incrementar la eficiencia de la selección en los programas de mejoramiento genético vegetal.Currently gene’s prediction problem is one of the main genomic challenges. Prediction allows performing experiments with high probability of interesting genes to be found and compare DNA regions of agronomic importance among genomes; besides, it helps to restrict the searching spaces into the data bases. A statistical procedure based on the R/S analysis and the Hurst coefficient was developed in order to characterize and predict genes and their structural components (exones and intrones) in the whole eukaryotic genomes of Arabidopsis thaliana, Oriza sativa and Mus musculus. Python programming language algorithms were developed with the purpose of extract, screen and modeling more than 80% of the registered gene sequences for these genomes in the NCBI Gene Bank data base. The R/S analysis allows to demonstrate that a structural order do exist in the distribution of the nucleotides which are constituting sequences with the memory or long range dependence phenomena predominance. The memory structure varies according to the sequences type and the species genome. The genes and exones sequences from the analyzed plant genomes showed a persistent behavior whereas those from the intrones had an anti-persistent behavior, in comparison with animal genome in which the three type of sequences showed persistent behavior. According to R/S analysis out coming parameters the genome sequences distribution pattern was replicated in a statistically similar manner in each chromosome belonging to one species, constituting fundamental evidences of invariance by scale change; it means each chromosome by itself is a statistical replication to a minor scale of the whole genome. The parameters constituted compact criteria in order to derivate sequences predictors (classifiers) which reached sensibility and specificity averages higher than 81% and 70% respectively. This procedure could be tried in other genomes and be used as a criterion in order to increasing selection efficiency in plant genetic breeding programs.application/mswordspaUniversidad Nacional de Colombia Sede Palmirahttp://revistas.unal.edu.co/index.php/acta_agronomica/article/view/20132Universidad Nacional de Colombia Revistas electrónicas UN Acta AgronómicaActa AgronómicaAlmanza Pinzón, Martha Isabel and López López, Karina and Téllez Villa, Carlos Eduardo (2010) Aplicación del análisis de rango reescalado r/s para la predicción de genes en el genoma vegetal. Acta Agronómica, 59 (4). pp. 473-487. ISSN 2323-01186 Tecnología (ciencias aplicadas) / Technology63 Agricultura y tecnologías relacionadas / AgricultureGenómica comparativapredicción de genesanálisis R/Scoeficiente de HurstArabidopsis thalianaOryza sativaMus musculus.Comparative genomicsgene’s predictionR/S analysisHurst coefficientArabidopsis thalianaOryza sativaMus musculus.Aplicación del análisis de rango reescalado r/s para la predicción de genes en el genoma vegetalArtículo de revistainfo:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/ARTORIGINAL20132-67525-1-PB.docapplication/msword1202688https://repositorio.unal.edu.co/bitstream/unal/33233/1/20132-67525-1-PB.doc4a2e5793ca268c2a2361e1e5ca1d4336MD5120132-67526-1-PB.pdfapplication/pdf298883https://repositorio.unal.edu.co/bitstream/unal/33233/2/20132-67526-1-PB.pdf15fc2e8c7a8bc91ac25a33617249426aMD52THUMBNAIL20132-67526-1-PB.pdf.jpg20132-67526-1-PB.pdf.jpgGenerated Thumbnailimage/jpeg7259https://repositorio.unal.edu.co/bitstream/unal/33233/3/20132-67526-1-PB.pdf.jpgcb85f3f0c51bbfb3d097b314ef9b6623MD53unal/33233oai:repositorio.unal.edu.co:unal/332332023-12-21 23:05:27.375Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |