Detección de homólogos remotos usando propiedades fisicoquímicas

En este artículo se presenta un nuevo método para la detección de homólogos remotos en proteínas llamado CDA (Análisis de Distribución de Característica). El método CDA utiliza distribuciones de las propiedades fisicoquímicas de los aminoácidos para cada proteína. Dadas las secuencias de entrenamien...

Full description

Autores:
Bedoya, Óscar
Tipo de recurso:
Article of journal
Fecha de publicación:
2017
Institución:
Universidad EIA .
Repositorio:
Repositorio EIA .
Idioma:
spa
OAI Identifier:
oai:repository.eia.edu.co:11190/5025
Acceso en línea:
https://repository.eia.edu.co/handle/11190/5025
https://doi.org/10.24050/reia.v14i27.1161
Palabra clave:
Detección de homólogos remotos
familia SCOP
propiedades fisicoquímicas.
Rights
openAccess
License
Revista EIA - 2017
id REIA2_7f459626f69e9c6e32d559e672e42b77
oai_identifier_str oai:repository.eia.edu.co:11190/5025
network_acronym_str REIA2
network_name_str Repositorio EIA .
repository_id_str
dc.title.spa.fl_str_mv Detección de homólogos remotos usando propiedades fisicoquímicas
dc.title.translated.eng.fl_str_mv Detección de homólogos remotos usando propiedades fisicoquímicas
title Detección de homólogos remotos usando propiedades fisicoquímicas
spellingShingle Detección de homólogos remotos usando propiedades fisicoquímicas
Detección de homólogos remotos
familia SCOP
propiedades fisicoquímicas.
title_short Detección de homólogos remotos usando propiedades fisicoquímicas
title_full Detección de homólogos remotos usando propiedades fisicoquímicas
title_fullStr Detección de homólogos remotos usando propiedades fisicoquímicas
title_full_unstemmed Detección de homólogos remotos usando propiedades fisicoquímicas
title_sort Detección de homólogos remotos usando propiedades fisicoquímicas
dc.creator.fl_str_mv Bedoya, Óscar
dc.contributor.author.spa.fl_str_mv Bedoya, Óscar
dc.subject.spa.fl_str_mv Detección de homólogos remotos
familia SCOP
propiedades fisicoquímicas.
topic Detección de homólogos remotos
familia SCOP
propiedades fisicoquímicas.
description En este artículo se presenta un nuevo método para la detección de homólogos remotos en proteínas llamado CDA (Análisis de Distribución de Característica). El método CDA utiliza distribuciones de las propiedades fisicoquímicas de los aminoácidos para cada proteína. Dadas las secuencias de entrenamiento de una familia SCOP (Clasificación Estructural de Proteínas), se calcula su correspondiente distribución característica promediando los valores de las distribuciones para las proteínas que la componen. La hipótesis en esta investigación es que cada familia de proteínas F tiene una distribución característica que separa sus secuencias del resto de las proteínas en un conjunto de datos. Se seleccionó un conjunto de 72 propiedades fisicoquímicas para crear diferentes distribuciones características de la misma familia. Cada distribución característica se usa como un clasificador de familias SCOP. Por último, se utiliza una clasificador Bayesiano para combinar la información de los clasificadores individuales y obtener una mejor decisión. Encontramos que cada familia tiene un conjunto de propiedades fisicoquímicas que permiten una mejor discriminación de sus secuencias. El método CDA alcanza una tasa de aciertos positivos de 0,793, una tasa de falsos positivos de 0,005 y un puntaje ROC de 0,918. El método propuesto mejora la precisión de algunas de las estrategias existentes tales como SVM-PCD y SVM-RQA.
publishDate 2017
dc.date.accessioned.none.fl_str_mv 2017-09-12 00:00:00
2022-06-17T20:19:42Z
dc.date.available.none.fl_str_mv 2017-09-12 00:00:00
2022-06-17T20:19:42Z
dc.date.issued.none.fl_str_mv 2017-09-12
dc.type.spa.fl_str_mv Artículo de revista
dc.type.eng.fl_str_mv Journal article
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_6501
http://purl.org/coar/resource_type/c_6501
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/article
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/ARTREF
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
format http://purl.org/coar/resource_type/c_6501
status_str publishedVersion
dc.identifier.issn.none.fl_str_mv 1794-1237
dc.identifier.uri.none.fl_str_mv https://repository.eia.edu.co/handle/11190/5025
dc.identifier.doi.none.fl_str_mv 10.24050/reia.v14i27.1161
dc.identifier.eissn.none.fl_str_mv 2463-0950
dc.identifier.url.none.fl_str_mv https://doi.org/10.24050/reia.v14i27.1161
identifier_str_mv 1794-1237
10.24050/reia.v14i27.1161
2463-0950
url https://repository.eia.edu.co/handle/11190/5025
https://doi.org/10.24050/reia.v14i27.1161
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.bitstream.none.fl_str_mv https://revistas.eia.edu.co/index.php/reveia/article/download/1161/1058
dc.relation.citationedition.spa.fl_str_mv Núm. 27 , Año 2017
dc.relation.citationendpage.none.fl_str_mv 125
dc.relation.citationissue.spa.fl_str_mv 27
dc.relation.citationstartpage.none.fl_str_mv 111
dc.relation.citationvolume.spa.fl_str_mv 14
dc.relation.ispartofjournal.spa.fl_str_mv Revista EIA
dc.rights.spa.fl_str_mv Revista EIA - 2017
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Revista EIA - 2017
https://creativecommons.org/licenses/by-nc-sa/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Fondo Editorial EIA - Universidad EIA
dc.source.spa.fl_str_mv https://revistas.eia.edu.co/index.php/reveia/article/view/1161
institution Universidad EIA .
bitstream.url.fl_str_mv https://repository.eia.edu.co/bitstreams/6c4cb812-a7e8-4e29-b393-8e31a51ab416/download
bitstream.checksum.fl_str_mv 2dada9371cc8b4d5f763f7eb338e3735
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositorio Institucional Universidad EIA
repository.mail.fl_str_mv bdigital@metabiblioteca.com
_version_ 1814100881352687616
spelling Bedoya, Óscar32cc8692d071e3e1058731dc570b0bab5002017-09-12 00:00:002022-06-17T20:19:42Z2017-09-12 00:00:002022-06-17T20:19:42Z2017-09-121794-1237https://repository.eia.edu.co/handle/11190/502510.24050/reia.v14i27.11612463-0950https://doi.org/10.24050/reia.v14i27.1161En este artículo se presenta un nuevo método para la detección de homólogos remotos en proteínas llamado CDA (Análisis de Distribución de Característica). El método CDA utiliza distribuciones de las propiedades fisicoquímicas de los aminoácidos para cada proteína. Dadas las secuencias de entrenamiento de una familia SCOP (Clasificación Estructural de Proteínas), se calcula su correspondiente distribución característica promediando los valores de las distribuciones para las proteínas que la componen. La hipótesis en esta investigación es que cada familia de proteínas F tiene una distribución característica que separa sus secuencias del resto de las proteínas en un conjunto de datos. Se seleccionó un conjunto de 72 propiedades fisicoquímicas para crear diferentes distribuciones características de la misma familia. Cada distribución característica se usa como un clasificador de familias SCOP. Por último, se utiliza una clasificador Bayesiano para combinar la información de los clasificadores individuales y obtener una mejor decisión. Encontramos que cada familia tiene un conjunto de propiedades fisicoquímicas que permiten una mejor discriminación de sus secuencias. El método CDA alcanza una tasa de aciertos positivos de 0,793, una tasa de falsos positivos de 0,005 y un puntaje ROC de 0,918. El método propuesto mejora la precisión de algunas de las estrategias existentes tales como SVM-PCD y SVM-RQA.En este artículo se presenta un nuevo método para la detección de homólogos remotos en proteínas llamado CDA (Análisis de Distribución de Característica). El método CDA utiliza distribuciones de las propiedades fisicoquímicas de los aminoácidos para cada proteína. Dadas las secuencias de entrenamiento de una familia SCOP (Clasificación Estructural de Proteínas), se calcula su correspondiente distribución característica promediando los valores de las distribuciones para las proteínas que la componen. La hipótesis en esta investigación es que cada familia de proteínas F tiene una distribución característica que separa sus secuencias del resto de las proteínas en un conjunto de datos. Se seleccionó un conjunto de 72 propiedades fisicoquímicas para crear diferentes distribuciones características de la misma familia. Cada distribución característica se usa como un clasificador de familias SCOP. Por último, se utiliza una clasificador Bayesiano para combinar la información de los clasificadores individuales y obtener una mejor decisión. Encontramos que cada familia tiene un conjunto de propiedades fisicoquímicas que permiten una mejor discriminación de sus secuencias. El método CDA alcanza una tasa de aciertos positivos de 0,793, una tasa de falsos positivos de 0,005 y un puntaje ROC de 0,918. El método propuesto mejora la precisión de algunas de las estrategias existentes tales como SVM-PCD y SVM-RQA.application/pdfspaFondo Editorial EIA - Universidad EIARevista EIA - 2017https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2https://revistas.eia.edu.co/index.php/reveia/article/view/1161Detección de homólogos remotosfamilia SCOPpropiedades fisicoquímicas.Detección de homólogos remotos usando propiedades fisicoquímicasDetección de homólogos remotos usando propiedades fisicoquímicasArtículo de revistaJournal articlehttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionTexthttp://purl.org/redcol/resource_type/ARTREFhttp://purl.org/coar/version/c_970fb48d4fbd8a85https://revistas.eia.edu.co/index.php/reveia/article/download/1161/1058Núm. 27 , Año 20171252711114Revista EIAPublicationOREORE.xmltext/xml2486https://repository.eia.edu.co/bitstreams/6c4cb812-a7e8-4e29-b393-8e31a51ab416/download2dada9371cc8b4d5f763f7eb338e3735MD5111190/5025oai:repository.eia.edu.co:11190/50252023-07-25 16:55:34.875https://creativecommons.org/licenses/by-nc-sa/4.0/Revista EIA - 2017metadata.onlyhttps://repository.eia.edu.coRepositorio Institucional Universidad EIAbdigital@metabiblioteca.com