Diseño y análisis de nuevos algoritmos en bioinformática

Dos metas importantes en la Biología Molecular Computacional son las búsquedas de regularidades en secuencias nucleicas o de la proteína, y encontrar las características que son comunes a un conjunto de tales secuencias. En todos los casos, la conservación de un patrón no es imperativo. La posibilid...

Full description

Autores:
Pinzón Ardila, Yoan José
Tipo de recurso:
Investigation report
Fecha de publicación:
2002
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/23883
Acceso en línea:
http://hdl.handle.net/20.500.12749/23883
Palabra clave:
Algorithm design and analysis
Bioinformatics
Algorithms
Information science
Biology (Data Processing)
Programming (Electronic computers)
Coding theory
Algoritmos
Ciencia de la información
Biología (Procesamiento de datos)
Programación (Computadores electrónicos)
Teoría de la codificación
Diseño y análisis de algoritmos
Bioinformática
Rights
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id UNAB2_018e4691e6064979745f8fa51ee80198
oai_identifier_str oai:repository.unab.edu.co:20.500.12749/23883
network_acronym_str UNAB2
network_name_str Repositorio UNAB
repository_id_str
dc.title.spa.fl_str_mv Diseño y análisis de nuevos algoritmos en bioinformática
dc.title.translated.spa.fl_str_mv Design and analysis of new algorithms in bioinformatics
title Diseño y análisis de nuevos algoritmos en bioinformática
spellingShingle Diseño y análisis de nuevos algoritmos en bioinformática
Algorithm design and analysis
Bioinformatics
Algorithms
Information science
Biology (Data Processing)
Programming (Electronic computers)
Coding theory
Algoritmos
Ciencia de la información
Biología (Procesamiento de datos)
Programación (Computadores electrónicos)
Teoría de la codificación
Diseño y análisis de algoritmos
Bioinformática
title_short Diseño y análisis de nuevos algoritmos en bioinformática
title_full Diseño y análisis de nuevos algoritmos en bioinformática
title_fullStr Diseño y análisis de nuevos algoritmos en bioinformática
title_full_unstemmed Diseño y análisis de nuevos algoritmos en bioinformática
title_sort Diseño y análisis de nuevos algoritmos en bioinformática
dc.creator.fl_str_mv Pinzón Ardila, Yoan José
dc.contributor.author.none.fl_str_mv Pinzón Ardila, Yoan José
dc.subject.keywords.spa.fl_str_mv Algorithm design and analysis
Bioinformatics
Algorithms
Information science
Biology (Data Processing)
Programming (Electronic computers)
Coding theory
topic Algorithm design and analysis
Bioinformatics
Algorithms
Information science
Biology (Data Processing)
Programming (Electronic computers)
Coding theory
Algoritmos
Ciencia de la información
Biología (Procesamiento de datos)
Programación (Computadores electrónicos)
Teoría de la codificación
Diseño y análisis de algoritmos
Bioinformática
dc.subject.lemb.spa.fl_str_mv Algoritmos
Ciencia de la información
Biología (Procesamiento de datos)
Programación (Computadores electrónicos)
Teoría de la codificación
dc.subject.proposal.spa.fl_str_mv Diseño y análisis de algoritmos
Bioinformática
description Dos metas importantes en la Biología Molecular Computacional son las búsquedas de regularidades en secuencias nucleicas o de la proteína, y encontrar las características que son comunes a un conjunto de tales secuencias. En todos los casos, la conservación de un patrón no es imperativo. La posibilidad de errores (substituciones, cancelaciones o inserciones) debe por lo tanto ser considerado. La flexibilidad se puede también introducir, alternativa o simultáneamente, permitiendo que los modelos sean escritos sobre un alfabeto integrado por los subconjuntos del alfabeto de los nucleótidos (ADN/ARN) o de los aminoácidos (proteínas), incluyendo el comodín (wild card). Las regularidades en una secuencia pueden venir bajo muchas fisonomías. Pueden corresponder a las repeticiones aproximadas dispersadas aleatoriamente a lo largo de la secuencia, o a las repeticiones que ocurren en una manera periódica o aproximadamente periódica, O bien a tandas de arreglos (tandem arrays). Para muchos de los problemas en biología molecular, en particular el estudio de la expresión y regulación del gen es importante poder deducir lo que se ha llamado "patrones estructurados". En este proyecto, dos algoritmos de naturaleza combinatoria se han propuesto como soluciones al problema de la búsqueda de cuadrados (squares) y búsquedas de cadenas evolutivas. En [1] se presenta un algoritmo capaz de encontrar “squars” en un tiempo O(n2). En [2] se trata el problema de evolución. Una cadena evolutiva es la deformación de una sub-cadena original (denominada la raíz). Esta deformación es lo que comúnmente se conoce con el nombre de una mutación. Una mutación ocurre cuando una base desaparece, es insertada o es simplemente sustituida. Aunque este articulo muestra su aplicación directa en la música es posible trasladar este concepto directamente a la Biología. Es claro que el conocimiento alcanzado con este estudio puede ser la base para posibles publicaciones directamente en la Biocomputación.
publishDate 2002
dc.date.issued.none.fl_str_mv 2002
dc.date.accessioned.none.fl_str_mv 2024-03-08T12:51:05Z
dc.date.available.none.fl_str_mv 2024-03-08T12:51:05Z
dc.type.eng.fl_str_mv Research report
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_8042
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/workingPaper
dc.type.local.spa.fl_str_mv Informe de investigación
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_18ws
dc.type.hasversion.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/IFI
format http://purl.org/coar/resource_type/c_18ws
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12749/23883
dc.identifier.instname.spa.fl_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional UNAB
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.unab.edu.co
url http://hdl.handle.net/20.500.12749/23883
identifier_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
reponame:Repositorio Institucional UNAB
repourl:https://repository.unab.edu.co
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Apostolico and M. Crochemore, String pattern matching for a deluge survival kit, in Handbook of Massive Data Sets, J. Abello and P.M. Pardalos and M.G.C. Resende, eds., Kluwer Academic Publishers, 2001. To appear.
A. Apostolico and R. Giancarlo, Sequence Alignment in Molecular Biology, Journal of Computational Biology 5,2 (1998)
M. Crochemore, C. S. lliopoulos, Y. J. Pinzon, J. F. Reid, '* AFast and Practical Bit— Vector Algorithm for the Longest Common Subsequence Problem" Information Processing Letters (IPL), 80(6), 2001, pp. 279-285.
M. Crochemore, C. $. lliopoulos, Y. J. Pinzon, * Computing Evolutionary Chains in Musical Sequences", Electronic Journal of Combinatorics (EJC), E. R. Scheinerman and J. Simpson, eds., special issue in honor of Aviezri Fraenkel, 8(2), 2000, pp. RS.
M. Crochemore, C. Hancart, Pattern matching in strings, in A/gorithms and Theory of Computation Handbook, Mikhail J. Atallah, ed., CRC Press, Boca Raton, 1998 Chapter 11.
M. Crochemore, R. Vérin. Zones of low entropy in genomic sequences. Computers and Chemistry 23 (1999) 275-282.
C. S. Iltopoulos, L. Mouchard, Y. J. Pinzon, *' The Max-Shift Algorithm for Approximate String Matching", Proc. of the 5-th Workshop on Algorithm Engineering (WAE'01), Aarhus, Denmark, G.S. Brodal and D. Frigioni and A. Marchetti-Spaccamela, eds., LNCS 2141, Springer—Verlag, 2001, pp. 13-25.
E. Myers, “Whole-Genome DNA Sequencing”, JEEE Computational Engineering and Science 3, 1 (1999), 33-43.
http://hrst.mit.edu/hrs/bioinformatics/public/Bibliography.htm
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.creativecommons.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.spatial.spa.fl_str_mv Bucaramanga (Santander, Colombia)
dc.coverage.campus.spa.fl_str_mv UNAB Campus Bucaramanga
dc.publisher.grantor.spa.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.publisher.faculty.spa.fl_str_mv Facultad Ingeniería
institution Universidad Autónoma de Bucaramanga - UNAB
bitstream.url.fl_str_mv https://repository.unab.edu.co/bitstream/20.500.12749/23883/1/2002_Informe_de_investigaci%c3%b3n_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/23883/2/2002_Presentaci%c3%b3n_de_informe_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/23883/3/license.txt
https://repository.unab.edu.co/bitstream/20.500.12749/23883/4/2002_Informe_de_investigaci%c3%b3n_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf.jpg
https://repository.unab.edu.co/bitstream/20.500.12749/23883/5/2002_Presentaci%c3%b3n_de_informe_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf.jpg
bitstream.checksum.fl_str_mv 32ea798ccecf4e34edc7a14f33413fcd
e3ca678748d8567e9663f2fbcee24bbd
3755c0cfdb77e29f2b9125d7a45dd316
1249e271927fa1de2e77dd0c2f07fd58
013e31a900a1697c5a881e98f1d59532
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB
repository.mail.fl_str_mv repositorio@unab.edu.co
_version_ 1814277353499525120
spelling Pinzón Ardila, Yoan José195a0a90-6e5d-4108-a5c7-01967717055aBucaramanga (Santander, Colombia)UNAB Campus Bucaramanga2024-03-08T12:51:05Z2024-03-08T12:51:05Z2002http://hdl.handle.net/20.500.12749/23883instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABrepourl:https://repository.unab.edu.coDos metas importantes en la Biología Molecular Computacional son las búsquedas de regularidades en secuencias nucleicas o de la proteína, y encontrar las características que son comunes a un conjunto de tales secuencias. En todos los casos, la conservación de un patrón no es imperativo. La posibilidad de errores (substituciones, cancelaciones o inserciones) debe por lo tanto ser considerado. La flexibilidad se puede también introducir, alternativa o simultáneamente, permitiendo que los modelos sean escritos sobre un alfabeto integrado por los subconjuntos del alfabeto de los nucleótidos (ADN/ARN) o de los aminoácidos (proteínas), incluyendo el comodín (wild card). Las regularidades en una secuencia pueden venir bajo muchas fisonomías. Pueden corresponder a las repeticiones aproximadas dispersadas aleatoriamente a lo largo de la secuencia, o a las repeticiones que ocurren en una manera periódica o aproximadamente periódica, O bien a tandas de arreglos (tandem arrays). Para muchos de los problemas en biología molecular, en particular el estudio de la expresión y regulación del gen es importante poder deducir lo que se ha llamado "patrones estructurados". En este proyecto, dos algoritmos de naturaleza combinatoria se han propuesto como soluciones al problema de la búsqueda de cuadrados (squares) y búsquedas de cadenas evolutivas. En [1] se presenta un algoritmo capaz de encontrar “squars” en un tiempo O(n2). En [2] se trata el problema de evolución. Una cadena evolutiva es la deformación de una sub-cadena original (denominada la raíz). Esta deformación es lo que comúnmente se conoce con el nombre de una mutación. Una mutación ocurre cuando una base desaparece, es insertada o es simplemente sustituida. Aunque este articulo muestra su aplicación directa en la música es posible trasladar este concepto directamente a la Biología. Es claro que el conocimiento alcanzado con este estudio puede ser la base para posibles publicaciones directamente en la Biocomputación.DESCRIPCIÓN DEL PROYECTO SINOPSIS RESUMEN INFORME DE RESULTADOS IMPACTOS INFORME FINANCIEROTwo important goals in Computational Molecular Biology are searches for regularities in nucleic or protein sequences, and finding features that are common to a set of such sequences. In all cases, preservation of a pattern is not imperative. The possibility of errors (substitutions, cancellations or insertions) must therefore be considered. Flexibility can also be introduced, alternatively or simultaneously, allowing models to be written on an alphabet composed of subsets of the alphabet of nucleotides (DNA/RNA) or amino acids (proteins), including the wild card. Regularities in a sequence can come in many forms. They may correspond to approximate repetitions dispersed randomly throughout the sequence, or to repetitions that occur in a periodic or approximately periodic manner, or to tandem arrays. For many problems in molecular biology, particularly the study of gene expression and regulation, it is important to be able to deduce what have been called "structured patterns." In this project, two algorithms of combinatorial nature have been proposed as solutions to the problem of searching for squares and searching for evolutionary chains. In [1] an algorithm capable of finding “squars” in O(n2) time is presented. In [2] the evolution problem is discussed. An evolutionary chain is the deformation of an original sub-chain (called the root). This deformation is what is commonly known as a mutation. A mutation occurs when a base disappears, is inserted, or is simply replaced. Although this article shows its direct application in music, it is possible to transfer this concept directly to Biology. It is clear that the knowledge achieved with this study can be the basis for possible publications directly in Biocomputing.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)Atribución-NoComercial-SinDerivadas 2.5 Colombiahttp://purl.org/coar/access_right/c_abf2Diseño y análisis de nuevos algoritmos en bioinformáticaDesign and analysis of new algorithms in bioinformaticsResearch reportinfo:eu-repo/semantics/workingPaperInforme de investigaciónhttp://purl.org/coar/resource_type/c_18wshttp://purl.org/coar/resource_type/c_8042info:eu-repo/semantics/acceptedVersionhttp://purl.org/redcol/resource_type/IFIUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaAlgorithm design and analysisBioinformaticsAlgorithmsInformation scienceBiology (Data Processing)Programming (Electronic computers)Coding theoryAlgoritmosCiencia de la informaciónBiología (Procesamiento de datos)Programación (Computadores electrónicos)Teoría de la codificaciónDiseño y análisis de algoritmosBioinformáticaApostolico and M. Crochemore, String pattern matching for a deluge survival kit, in Handbook of Massive Data Sets, J. Abello and P.M. Pardalos and M.G.C. Resende, eds., Kluwer Academic Publishers, 2001. To appear.A. Apostolico and R. Giancarlo, Sequence Alignment in Molecular Biology, Journal of Computational Biology 5,2 (1998)M. Crochemore, C. S. lliopoulos, Y. J. Pinzon, J. F. Reid, '* AFast and Practical Bit— Vector Algorithm for the Longest Common Subsequence Problem" Information Processing Letters (IPL), 80(6), 2001, pp. 279-285.M. Crochemore, C. $. lliopoulos, Y. J. Pinzon, * Computing Evolutionary Chains in Musical Sequences", Electronic Journal of Combinatorics (EJC), E. R. Scheinerman and J. Simpson, eds., special issue in honor of Aviezri Fraenkel, 8(2), 2000, pp. RS.M. Crochemore, C. Hancart, Pattern matching in strings, in A/gorithms and Theory of Computation Handbook, Mikhail J. Atallah, ed., CRC Press, Boca Raton, 1998 Chapter 11.M. Crochemore, R. Vérin. Zones of low entropy in genomic sequences. Computers and Chemistry 23 (1999) 275-282.C. S. Iltopoulos, L. Mouchard, Y. J. Pinzon, *' The Max-Shift Algorithm for Approximate String Matching", Proc. of the 5-th Workshop on Algorithm Engineering (WAE'01), Aarhus, Denmark, G.S. Brodal and D. Frigioni and A. Marchetti-Spaccamela, eds., LNCS 2141, Springer—Verlag, 2001, pp. 13-25.E. Myers, “Whole-Genome DNA Sequencing”, JEEE Computational Engineering and Science 3, 1 (1999), 33-43.http://hrst.mit.edu/hrs/bioinformatics/public/Bibliography.htmORIGINAL2002_Informe_de_investigación_Pinzon_Ardila_Yoan_José.pdf2002_Informe_de_investigación_Pinzon_Ardila_Yoan_José.pdfInforme de investigaciónapplication/pdf1284309https://repository.unab.edu.co/bitstream/20.500.12749/23883/1/2002_Informe_de_investigaci%c3%b3n_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf32ea798ccecf4e34edc7a14f33413fcdMD51open access2002_Presentación_de_informe_Pinzon_Ardila_Yoan_José.pdf2002_Presentación_de_informe_Pinzon_Ardila_Yoan_José.pdfPresentación de informeapplication/pdf6565060https://repository.unab.edu.co/bitstream/20.500.12749/23883/2/2002_Presentaci%c3%b3n_de_informe_Pinzon_Ardila_Yoan_Jos%c3%a9.pdfe3ca678748d8567e9663f2fbcee24bbdMD52open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8829https://repository.unab.edu.co/bitstream/20.500.12749/23883/3/license.txt3755c0cfdb77e29f2b9125d7a45dd316MD53open accessTHUMBNAIL2002_Informe_de_investigación_Pinzon_Ardila_Yoan_José.pdf.jpg2002_Informe_de_investigación_Pinzon_Ardila_Yoan_José.pdf.jpgIM Thumbnailimage/jpeg7886https://repository.unab.edu.co/bitstream/20.500.12749/23883/4/2002_Informe_de_investigaci%c3%b3n_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf.jpg1249e271927fa1de2e77dd0c2f07fd58MD54open access2002_Presentación_de_informe_Pinzon_Ardila_Yoan_José.pdf.jpg2002_Presentación_de_informe_Pinzon_Ardila_Yoan_José.pdf.jpgIM Thumbnailimage/jpeg12228https://repository.unab.edu.co/bitstream/20.500.12749/23883/5/2002_Presentaci%c3%b3n_de_informe_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf.jpg013e31a900a1697c5a881e98f1d59532MD55open access20.500.12749/23883oai:repository.unab.edu.co:20.500.12749/238832024-03-08 22:00:43.836open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbi4gRWwgQVVUT1IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBlbiBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVTkFCIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8gZGUgYnVlbmEgZmUuCgpFbCBBVVRPUiBhdXRvcml6YSBhIGxhIFVuaXZlcnNpZGFkIEF1dMOzbm9tYSBkZSBCdWNhcmFtYW5nYSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24uCg==