Una métrica sobre grafos ponderados como medida de similitud molecular
Los objetivos de este trabajo fueron proponer una métrica que permitiera comparar grafos ponderados con diferente numero de vértices, y que tuviera en cuenta no solo los vértices en los que se diferencian un par de grafos, sino también los vértices con los que se relacionan, y evaluar la similitud m...
- Autores:
-
Melo Ospina, Jenny Adriana
- Tipo de recurso:
- Fecha de publicación:
- 2011
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/10867
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/10867
http://bdigital.unal.edu.co/8126/
- Palabra clave:
- 54 Química y ciencias afines / Chemistry
Similitud molecular
métrica
grafo
análisis de agrupamiento
QSAR / Molecular Similarity
Metric
Graph
Clustering
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_91258b467303834a6483313113ed4200 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/10867 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Una métrica sobre grafos ponderados como medida de similitud molecular |
title |
Una métrica sobre grafos ponderados como medida de similitud molecular |
spellingShingle |
Una métrica sobre grafos ponderados como medida de similitud molecular 54 Química y ciencias afines / Chemistry Similitud molecular métrica grafo análisis de agrupamiento QSAR / Molecular Similarity Metric Graph Clustering |
title_short |
Una métrica sobre grafos ponderados como medida de similitud molecular |
title_full |
Una métrica sobre grafos ponderados como medida de similitud molecular |
title_fullStr |
Una métrica sobre grafos ponderados como medida de similitud molecular |
title_full_unstemmed |
Una métrica sobre grafos ponderados como medida de similitud molecular |
title_sort |
Una métrica sobre grafos ponderados como medida de similitud molecular |
dc.creator.fl_str_mv |
Melo Ospina, Jenny Adriana |
dc.contributor.author.spa.fl_str_mv |
Melo Ospina, Jenny Adriana |
dc.contributor.spa.fl_str_mv |
Daza Caicedo, Edgar Eduardo |
dc.subject.ddc.spa.fl_str_mv |
54 Química y ciencias afines / Chemistry |
topic |
54 Química y ciencias afines / Chemistry Similitud molecular métrica grafo análisis de agrupamiento QSAR / Molecular Similarity Metric Graph Clustering |
dc.subject.proposal.spa.fl_str_mv |
Similitud molecular métrica grafo análisis de agrupamiento QSAR / Molecular Similarity Metric Graph Clustering |
description |
Los objetivos de este trabajo fueron proponer una métrica que permitiera comparar grafos ponderados con diferente numero de vértices, y que tuviera en cuenta no solo los vértices en los que se diferencian un par de grafos, sino también los vértices con los que se relacionan, y evaluar la similitud molecular por medio de la métrica propuesta. Para hacerlo se propuso una función d◊ : G x G →R, donde G es el conjunto de todos los grafos sin vértices aislados unido a un conjunto que contiene al grafo de un solo vértice K1, y R son los números reales, luego se demostró que esta función es una métrica. Posteriormente se construyeron los grafos moleculares de 21 esteroides y a partir de ellos se generó un supergrafo que fue etiquetado por medio de un algoritmo propuesto por Balaban et al.[1]. Las etiquetas asignadas se usaron para los vértices de los grafos moleculares. Usando Microsoft Excel Solver [2], se hizo la ponderación de los vértices de los grafos moleculares, haciendo que la matriz de similitud obtenida al comparar los grafos moleculares de los esteroides tuviera la mayor correlación posible con las matrices de similitud experimentales, obtenidas a partir de la afinidad de los esteroides por la globulina fijadora de corticosteroides CBG y por la globulina fijadora de testosterona TeBG. Se hicieron análisis de agrupamiento UPGMA usando grafos no ponderados, y ponderados con respecto a la afinidad por la CBG y la TeBG. Del dendrograma obtenido para el primer caso, se puede afirmar que la métrica es capaz de codificar las diferencias estructurales de los esteroides. En los dendrogramas obtenidos a partir de los grafos ponderados, se observó que el entrenamiento de los vértices efectivamente enriquece a los grafos con información sobre la actividad del compuesto que representan. Por último se construyeron cinco modelos QSAR: dos para predecir la afinidad por la CBG y tres para predecir la afinidad por la TeBG. Los dos modelos para predecir la afinidad por la CBG y uno de los modelos para predecir la afinidad por la TeBG tienen buenos ajustes, sin estar sobreajustados, son robustos y hacen predicciones estadísticamente significativas. / Abstract. One of the goals of this work was to propose a metric useful to compare weighted graphs with different number of vertices, and that it takes into account not only vertices that make two graphs different, but also vertices which are related to them. The other goal was to evaluate molecular similarity using the proposed metric. To do so, d◊ : G x G →R a function was proposed, with G the set of all graphs without isolated vertices union a set containing the one-vertex graph K1, and R, the real numbers. Then it was proved that this function is a metric. Later, molecular graphs from 21 steroids were made, and from them, a supergraph was generated. It was labeled using an algorithm proposed by Balaban et al.[1]. Labels asigned to supergraph's vertices were used to molecular graph's vertices. Molecular graph's vertex weighting was done using Microsoft Excel Solver [2], making similarity matrix obtained from molecular graph comparison to have the greatest possible correlation with experimental similarity matrices, obtained from the binding affinities of the steroids with the corticosteroid binding globulin CBG and the testosterone binding globulin. UPGMA Clustering was done using non-weighted and weighted graphs, with respect to affinity with CBG and with TeBG. From the dendrogram obtained in the first case, it can be stated that the metric is able to codify structural differences among steroids. In the dendrograms obtained from weighted graphs, it was observed that vertex training really enrich graphs with information about the activity of the compounds they represent. At last, five QSAR models were developed: two to predict the affinity with CBG and three to predict the affinity with TeBG. Both models to predict affinity with CBG and one of the models to predict affinity with TeBG have satisfactory good-ness-of-fit, are not over-of- fit, are robust and make statistically significant predictions |
publishDate |
2011 |
dc.date.issued.spa.fl_str_mv |
2011 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-24T23:48:52Z |
dc.date.available.spa.fl_str_mv |
2019-06-24T23:48:52Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/10867 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/8126/ |
url |
https://repositorio.unal.edu.co/handle/unal/10867 http://bdigital.unal.edu.co/8126/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de Química Departamento de Química |
dc.relation.references.spa.fl_str_mv |
Melo Ospina, Jenny Adriana (2011) Una métrica sobre grafos ponderados como medida de similitud molecular. Maestría thesis, Universidad Nacional de Colombia. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/10867/1/jennyadrianameloospina.2011.pdf https://repositorio.unal.edu.co/bitstream/unal/10867/2/jennyadrianameloospina.2011.pdf.jpg |
bitstream.checksum.fl_str_mv |
178d7332de5b1617e3ba9ea486fe940a a486d22dc29480d90e45ea0983738571 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814090202429259776 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Daza Caicedo, Edgar EduardoMelo Ospina, Jenny Adrianaa78a2a4a-95c8-4862-80ef-8bdef346d8b63002019-06-24T23:48:52Z2019-06-24T23:48:52Z2011https://repositorio.unal.edu.co/handle/unal/10867http://bdigital.unal.edu.co/8126/Los objetivos de este trabajo fueron proponer una métrica que permitiera comparar grafos ponderados con diferente numero de vértices, y que tuviera en cuenta no solo los vértices en los que se diferencian un par de grafos, sino también los vértices con los que se relacionan, y evaluar la similitud molecular por medio de la métrica propuesta. Para hacerlo se propuso una función d◊ : G x G →R, donde G es el conjunto de todos los grafos sin vértices aislados unido a un conjunto que contiene al grafo de un solo vértice K1, y R son los números reales, luego se demostró que esta función es una métrica. Posteriormente se construyeron los grafos moleculares de 21 esteroides y a partir de ellos se generó un supergrafo que fue etiquetado por medio de un algoritmo propuesto por Balaban et al.[1]. Las etiquetas asignadas se usaron para los vértices de los grafos moleculares. Usando Microsoft Excel Solver [2], se hizo la ponderación de los vértices de los grafos moleculares, haciendo que la matriz de similitud obtenida al comparar los grafos moleculares de los esteroides tuviera la mayor correlación posible con las matrices de similitud experimentales, obtenidas a partir de la afinidad de los esteroides por la globulina fijadora de corticosteroides CBG y por la globulina fijadora de testosterona TeBG. Se hicieron análisis de agrupamiento UPGMA usando grafos no ponderados, y ponderados con respecto a la afinidad por la CBG y la TeBG. Del dendrograma obtenido para el primer caso, se puede afirmar que la métrica es capaz de codificar las diferencias estructurales de los esteroides. En los dendrogramas obtenidos a partir de los grafos ponderados, se observó que el entrenamiento de los vértices efectivamente enriquece a los grafos con información sobre la actividad del compuesto que representan. Por último se construyeron cinco modelos QSAR: dos para predecir la afinidad por la CBG y tres para predecir la afinidad por la TeBG. Los dos modelos para predecir la afinidad por la CBG y uno de los modelos para predecir la afinidad por la TeBG tienen buenos ajustes, sin estar sobreajustados, son robustos y hacen predicciones estadísticamente significativas. / Abstract. One of the goals of this work was to propose a metric useful to compare weighted graphs with different number of vertices, and that it takes into account not only vertices that make two graphs different, but also vertices which are related to them. The other goal was to evaluate molecular similarity using the proposed metric. To do so, d◊ : G x G →R a function was proposed, with G the set of all graphs without isolated vertices union a set containing the one-vertex graph K1, and R, the real numbers. Then it was proved that this function is a metric. Later, molecular graphs from 21 steroids were made, and from them, a supergraph was generated. It was labeled using an algorithm proposed by Balaban et al.[1]. Labels asigned to supergraph's vertices were used to molecular graph's vertices. Molecular graph's vertex weighting was done using Microsoft Excel Solver [2], making similarity matrix obtained from molecular graph comparison to have the greatest possible correlation with experimental similarity matrices, obtained from the binding affinities of the steroids with the corticosteroid binding globulin CBG and the testosterone binding globulin. UPGMA Clustering was done using non-weighted and weighted graphs, with respect to affinity with CBG and with TeBG. From the dendrogram obtained in the first case, it can be stated that the metric is able to codify structural differences among steroids. In the dendrograms obtained from weighted graphs, it was observed that vertex training really enrich graphs with information about the activity of the compounds they represent. At last, five QSAR models were developed: two to predict the affinity with CBG and three to predict the affinity with TeBG. Both models to predict affinity with CBG and one of the models to predict affinity with TeBG have satisfactory good-ness-of-fit, are not over-of- fit, are robust and make statistically significant predictionsMaestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de QuímicaDepartamento de QuímicaMelo Ospina, Jenny Adriana (2011) Una métrica sobre grafos ponderados como medida de similitud molecular. Maestría thesis, Universidad Nacional de Colombia.54 Química y ciencias afines / ChemistrySimilitud molecularmétricagrafoanálisis de agrupamientoQSAR / Molecular SimilarityMetricGraphClusteringUna métrica sobre grafos ponderados como medida de similitud molecularTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINALjennyadrianameloospina.2011.pdfapplication/pdf3792241https://repositorio.unal.edu.co/bitstream/unal/10867/1/jennyadrianameloospina.2011.pdf178d7332de5b1617e3ba9ea486fe940aMD51THUMBNAILjennyadrianameloospina.2011.pdf.jpgjennyadrianameloospina.2011.pdf.jpgGenerated Thumbnailimage/jpeg4066https://repositorio.unal.edu.co/bitstream/unal/10867/2/jennyadrianameloospina.2011.pdf.jpga486d22dc29480d90e45ea0983738571MD52unal/10867oai:repositorio.unal.edu.co:unal/108672022-11-15 21:38:50.425Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |