Diseño y análisis de nuevos algoritmos en bioinformática
Dos metas importantes en la Biología Molecular Computacional son las búsquedas de regularidades en secuencias nucleicas o de la proteína, y encontrar las características que son comunes a un conjunto de tales secuencias. En todos los casos, la conservación de un patrón no es imperativo. La posibilid...
- Autores:
-
Pinzón Ardila, Yoan José
- Tipo de recurso:
- Investigation report
- Fecha de publicación:
- 2002
- Institución:
- Universidad Autónoma de Bucaramanga - UNAB
- Repositorio:
- Repositorio UNAB
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unab.edu.co:20.500.12749/23883
- Acceso en línea:
- http://hdl.handle.net/20.500.12749/23883
- Palabra clave:
- Algorithm design and analysis
Bioinformatics
Algorithms
Information science
Biology (Data Processing)
Programming (Electronic computers)
Coding theory
Algoritmos
Ciencia de la información
Biología (Procesamiento de datos)
Programación (Computadores electrónicos)
Teoría de la codificación
Diseño y análisis de algoritmos
Bioinformática
- Rights
- License
- http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id |
UNAB2_018e4691e6064979745f8fa51ee80198 |
---|---|
oai_identifier_str |
oai:repository.unab.edu.co:20.500.12749/23883 |
network_acronym_str |
UNAB2 |
network_name_str |
Repositorio UNAB |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Diseño y análisis de nuevos algoritmos en bioinformática |
dc.title.translated.spa.fl_str_mv |
Design and analysis of new algorithms in bioinformatics |
title |
Diseño y análisis de nuevos algoritmos en bioinformática |
spellingShingle |
Diseño y análisis de nuevos algoritmos en bioinformática Algorithm design and analysis Bioinformatics Algorithms Information science Biology (Data Processing) Programming (Electronic computers) Coding theory Algoritmos Ciencia de la información Biología (Procesamiento de datos) Programación (Computadores electrónicos) Teoría de la codificación Diseño y análisis de algoritmos Bioinformática |
title_short |
Diseño y análisis de nuevos algoritmos en bioinformática |
title_full |
Diseño y análisis de nuevos algoritmos en bioinformática |
title_fullStr |
Diseño y análisis de nuevos algoritmos en bioinformática |
title_full_unstemmed |
Diseño y análisis de nuevos algoritmos en bioinformática |
title_sort |
Diseño y análisis de nuevos algoritmos en bioinformática |
dc.creator.fl_str_mv |
Pinzón Ardila, Yoan José |
dc.contributor.author.none.fl_str_mv |
Pinzón Ardila, Yoan José |
dc.subject.keywords.spa.fl_str_mv |
Algorithm design and analysis Bioinformatics Algorithms Information science Biology (Data Processing) Programming (Electronic computers) Coding theory |
topic |
Algorithm design and analysis Bioinformatics Algorithms Information science Biology (Data Processing) Programming (Electronic computers) Coding theory Algoritmos Ciencia de la información Biología (Procesamiento de datos) Programación (Computadores electrónicos) Teoría de la codificación Diseño y análisis de algoritmos Bioinformática |
dc.subject.lemb.spa.fl_str_mv |
Algoritmos Ciencia de la información Biología (Procesamiento de datos) Programación (Computadores electrónicos) Teoría de la codificación |
dc.subject.proposal.spa.fl_str_mv |
Diseño y análisis de algoritmos Bioinformática |
description |
Dos metas importantes en la Biología Molecular Computacional son las búsquedas de regularidades en secuencias nucleicas o de la proteína, y encontrar las características que son comunes a un conjunto de tales secuencias. En todos los casos, la conservación de un patrón no es imperativo. La posibilidad de errores (substituciones, cancelaciones o inserciones) debe por lo tanto ser considerado. La flexibilidad se puede también introducir, alternativa o simultáneamente, permitiendo que los modelos sean escritos sobre un alfabeto integrado por los subconjuntos del alfabeto de los nucleótidos (ADN/ARN) o de los aminoácidos (proteínas), incluyendo el comodín (wild card). Las regularidades en una secuencia pueden venir bajo muchas fisonomías. Pueden corresponder a las repeticiones aproximadas dispersadas aleatoriamente a lo largo de la secuencia, o a las repeticiones que ocurren en una manera periódica o aproximadamente periódica, O bien a tandas de arreglos (tandem arrays). Para muchos de los problemas en biología molecular, en particular el estudio de la expresión y regulación del gen es importante poder deducir lo que se ha llamado "patrones estructurados". En este proyecto, dos algoritmos de naturaleza combinatoria se han propuesto como soluciones al problema de la búsqueda de cuadrados (squares) y búsquedas de cadenas evolutivas. En [1] se presenta un algoritmo capaz de encontrar “squars” en un tiempo O(n2). En [2] se trata el problema de evolución. Una cadena evolutiva es la deformación de una sub-cadena original (denominada la raíz). Esta deformación es lo que comúnmente se conoce con el nombre de una mutación. Una mutación ocurre cuando una base desaparece, es insertada o es simplemente sustituida. Aunque este articulo muestra su aplicación directa en la música es posible trasladar este concepto directamente a la Biología. Es claro que el conocimiento alcanzado con este estudio puede ser la base para posibles publicaciones directamente en la Biocomputación. |
publishDate |
2002 |
dc.date.issued.none.fl_str_mv |
2002 |
dc.date.accessioned.none.fl_str_mv |
2024-03-08T12:51:05Z |
dc.date.available.none.fl_str_mv |
2024-03-08T12:51:05Z |
dc.type.eng.fl_str_mv |
Research report |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_8042 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/workingPaper |
dc.type.local.spa.fl_str_mv |
Informe de investigación |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_18ws |
dc.type.hasversion.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/IFI |
format |
http://purl.org/coar/resource_type/c_18ws |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12749/23883 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional UNAB |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repository.unab.edu.co |
url |
http://hdl.handle.net/20.500.12749/23883 |
identifier_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB reponame:Repositorio Institucional UNAB repourl:https://repository.unab.edu.co |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.references.spa.fl_str_mv |
Apostolico and M. Crochemore, String pattern matching for a deluge survival kit, in Handbook of Massive Data Sets, J. Abello and P.M. Pardalos and M.G.C. Resende, eds., Kluwer Academic Publishers, 2001. To appear. A. Apostolico and R. Giancarlo, Sequence Alignment in Molecular Biology, Journal of Computational Biology 5,2 (1998) M. Crochemore, C. S. lliopoulos, Y. J. Pinzon, J. F. Reid, '* AFast and Practical Bit— Vector Algorithm for the Longest Common Subsequence Problem" Information Processing Letters (IPL), 80(6), 2001, pp. 279-285. M. Crochemore, C. $. lliopoulos, Y. J. Pinzon, * Computing Evolutionary Chains in Musical Sequences", Electronic Journal of Combinatorics (EJC), E. R. Scheinerman and J. Simpson, eds., special issue in honor of Aviezri Fraenkel, 8(2), 2000, pp. RS. M. Crochemore, C. Hancart, Pattern matching in strings, in A/gorithms and Theory of Computation Handbook, Mikhail J. Atallah, ed., CRC Press, Boca Raton, 1998 Chapter 11. M. Crochemore, R. Vérin. Zones of low entropy in genomic sequences. Computers and Chemistry 23 (1999) 275-282. C. S. Iltopoulos, L. Mouchard, Y. J. Pinzon, *' The Max-Shift Algorithm for Approximate String Matching", Proc. of the 5-th Workshop on Algorithm Engineering (WAE'01), Aarhus, Denmark, G.S. Brodal and D. Frigioni and A. Marchetti-Spaccamela, eds., LNCS 2141, Springer—Verlag, 2001, pp. 13-25. E. Myers, “Whole-Genome DNA Sequencing”, JEEE Computational Engineering and Science 3, 1 (1999), 33-43. http://hrst.mit.edu/hrs/bioinformatics/public/Bibliography.htm |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.local.spa.fl_str_mv |
Abierto (Texto Completo) |
dc.rights.creativecommons.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ Abierto (Texto Completo) Atribución-NoComercial-SinDerivadas 2.5 Colombia http://purl.org/coar/access_right/c_abf2 |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.coverage.spatial.spa.fl_str_mv |
Bucaramanga (Santander, Colombia) |
dc.coverage.campus.spa.fl_str_mv |
UNAB Campus Bucaramanga |
dc.publisher.grantor.spa.fl_str_mv |
Universidad Autónoma de Bucaramanga UNAB |
dc.publisher.faculty.spa.fl_str_mv |
Facultad Ingeniería |
institution |
Universidad Autónoma de Bucaramanga - UNAB |
bitstream.url.fl_str_mv |
https://repository.unab.edu.co/bitstream/20.500.12749/23883/1/2002_Informe_de_investigaci%c3%b3n_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf https://repository.unab.edu.co/bitstream/20.500.12749/23883/2/2002_Presentaci%c3%b3n_de_informe_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf https://repository.unab.edu.co/bitstream/20.500.12749/23883/3/license.txt https://repository.unab.edu.co/bitstream/20.500.12749/23883/4/2002_Informe_de_investigaci%c3%b3n_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf.jpg https://repository.unab.edu.co/bitstream/20.500.12749/23883/5/2002_Presentaci%c3%b3n_de_informe_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf.jpg |
bitstream.checksum.fl_str_mv |
32ea798ccecf4e34edc7a14f33413fcd e3ca678748d8567e9663f2fbcee24bbd 3755c0cfdb77e29f2b9125d7a45dd316 1249e271927fa1de2e77dd0c2f07fd58 013e31a900a1697c5a881e98f1d59532 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB |
repository.mail.fl_str_mv |
repositorio@unab.edu.co |
_version_ |
1814277353499525120 |
spelling |
Pinzón Ardila, Yoan José195a0a90-6e5d-4108-a5c7-01967717055aBucaramanga (Santander, Colombia)UNAB Campus Bucaramanga2024-03-08T12:51:05Z2024-03-08T12:51:05Z2002http://hdl.handle.net/20.500.12749/23883instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABrepourl:https://repository.unab.edu.coDos metas importantes en la Biología Molecular Computacional son las búsquedas de regularidades en secuencias nucleicas o de la proteína, y encontrar las características que son comunes a un conjunto de tales secuencias. En todos los casos, la conservación de un patrón no es imperativo. La posibilidad de errores (substituciones, cancelaciones o inserciones) debe por lo tanto ser considerado. La flexibilidad se puede también introducir, alternativa o simultáneamente, permitiendo que los modelos sean escritos sobre un alfabeto integrado por los subconjuntos del alfabeto de los nucleótidos (ADN/ARN) o de los aminoácidos (proteínas), incluyendo el comodín (wild card). Las regularidades en una secuencia pueden venir bajo muchas fisonomías. Pueden corresponder a las repeticiones aproximadas dispersadas aleatoriamente a lo largo de la secuencia, o a las repeticiones que ocurren en una manera periódica o aproximadamente periódica, O bien a tandas de arreglos (tandem arrays). Para muchos de los problemas en biología molecular, en particular el estudio de la expresión y regulación del gen es importante poder deducir lo que se ha llamado "patrones estructurados". En este proyecto, dos algoritmos de naturaleza combinatoria se han propuesto como soluciones al problema de la búsqueda de cuadrados (squares) y búsquedas de cadenas evolutivas. En [1] se presenta un algoritmo capaz de encontrar “squars” en un tiempo O(n2). En [2] se trata el problema de evolución. Una cadena evolutiva es la deformación de una sub-cadena original (denominada la raíz). Esta deformación es lo que comúnmente se conoce con el nombre de una mutación. Una mutación ocurre cuando una base desaparece, es insertada o es simplemente sustituida. Aunque este articulo muestra su aplicación directa en la música es posible trasladar este concepto directamente a la Biología. Es claro que el conocimiento alcanzado con este estudio puede ser la base para posibles publicaciones directamente en la Biocomputación.DESCRIPCIÓN DEL PROYECTO SINOPSIS RESUMEN INFORME DE RESULTADOS IMPACTOS INFORME FINANCIEROTwo important goals in Computational Molecular Biology are searches for regularities in nucleic or protein sequences, and finding features that are common to a set of such sequences. In all cases, preservation of a pattern is not imperative. The possibility of errors (substitutions, cancellations or insertions) must therefore be considered. Flexibility can also be introduced, alternatively or simultaneously, allowing models to be written on an alphabet composed of subsets of the alphabet of nucleotides (DNA/RNA) or amino acids (proteins), including the wild card. Regularities in a sequence can come in many forms. They may correspond to approximate repetitions dispersed randomly throughout the sequence, or to repetitions that occur in a periodic or approximately periodic manner, or to tandem arrays. For many problems in molecular biology, particularly the study of gene expression and regulation, it is important to be able to deduce what have been called "structured patterns." In this project, two algorithms of combinatorial nature have been proposed as solutions to the problem of searching for squares and searching for evolutionary chains. In [1] an algorithm capable of finding “squars” in O(n2) time is presented. In [2] the evolution problem is discussed. An evolutionary chain is the deformation of an original sub-chain (called the root). This deformation is what is commonly known as a mutation. A mutation occurs when a base disappears, is inserted, or is simply replaced. Although this article shows its direct application in music, it is possible to transfer this concept directly to Biology. It is clear that the knowledge achieved with this study can be the basis for possible publications directly in Biocomputing.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)Atribución-NoComercial-SinDerivadas 2.5 Colombiahttp://purl.org/coar/access_right/c_abf2Diseño y análisis de nuevos algoritmos en bioinformáticaDesign and analysis of new algorithms in bioinformaticsResearch reportinfo:eu-repo/semantics/workingPaperInforme de investigaciónhttp://purl.org/coar/resource_type/c_18wshttp://purl.org/coar/resource_type/c_8042info:eu-repo/semantics/acceptedVersionhttp://purl.org/redcol/resource_type/IFIUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaAlgorithm design and analysisBioinformaticsAlgorithmsInformation scienceBiology (Data Processing)Programming (Electronic computers)Coding theoryAlgoritmosCiencia de la informaciónBiología (Procesamiento de datos)Programación (Computadores electrónicos)Teoría de la codificaciónDiseño y análisis de algoritmosBioinformáticaApostolico and M. Crochemore, String pattern matching for a deluge survival kit, in Handbook of Massive Data Sets, J. Abello and P.M. Pardalos and M.G.C. Resende, eds., Kluwer Academic Publishers, 2001. To appear.A. Apostolico and R. Giancarlo, Sequence Alignment in Molecular Biology, Journal of Computational Biology 5,2 (1998)M. Crochemore, C. S. lliopoulos, Y. J. Pinzon, J. F. Reid, '* AFast and Practical Bit— Vector Algorithm for the Longest Common Subsequence Problem" Information Processing Letters (IPL), 80(6), 2001, pp. 279-285.M. Crochemore, C. $. lliopoulos, Y. J. Pinzon, * Computing Evolutionary Chains in Musical Sequences", Electronic Journal of Combinatorics (EJC), E. R. Scheinerman and J. Simpson, eds., special issue in honor of Aviezri Fraenkel, 8(2), 2000, pp. RS.M. Crochemore, C. Hancart, Pattern matching in strings, in A/gorithms and Theory of Computation Handbook, Mikhail J. Atallah, ed., CRC Press, Boca Raton, 1998 Chapter 11.M. Crochemore, R. Vérin. Zones of low entropy in genomic sequences. Computers and Chemistry 23 (1999) 275-282.C. S. Iltopoulos, L. Mouchard, Y. J. Pinzon, *' The Max-Shift Algorithm for Approximate String Matching", Proc. of the 5-th Workshop on Algorithm Engineering (WAE'01), Aarhus, Denmark, G.S. Brodal and D. Frigioni and A. Marchetti-Spaccamela, eds., LNCS 2141, Springer—Verlag, 2001, pp. 13-25.E. Myers, “Whole-Genome DNA Sequencing”, JEEE Computational Engineering and Science 3, 1 (1999), 33-43.http://hrst.mit.edu/hrs/bioinformatics/public/Bibliography.htmORIGINAL2002_Informe_de_investigación_Pinzon_Ardila_Yoan_José.pdf2002_Informe_de_investigación_Pinzon_Ardila_Yoan_José.pdfInforme de investigaciónapplication/pdf1284309https://repository.unab.edu.co/bitstream/20.500.12749/23883/1/2002_Informe_de_investigaci%c3%b3n_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf32ea798ccecf4e34edc7a14f33413fcdMD51open access2002_Presentación_de_informe_Pinzon_Ardila_Yoan_José.pdf2002_Presentación_de_informe_Pinzon_Ardila_Yoan_José.pdfPresentación de informeapplication/pdf6565060https://repository.unab.edu.co/bitstream/20.500.12749/23883/2/2002_Presentaci%c3%b3n_de_informe_Pinzon_Ardila_Yoan_Jos%c3%a9.pdfe3ca678748d8567e9663f2fbcee24bbdMD52open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8829https://repository.unab.edu.co/bitstream/20.500.12749/23883/3/license.txt3755c0cfdb77e29f2b9125d7a45dd316MD53open accessTHUMBNAIL2002_Informe_de_investigación_Pinzon_Ardila_Yoan_José.pdf.jpg2002_Informe_de_investigación_Pinzon_Ardila_Yoan_José.pdf.jpgIM Thumbnailimage/jpeg7886https://repository.unab.edu.co/bitstream/20.500.12749/23883/4/2002_Informe_de_investigaci%c3%b3n_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf.jpg1249e271927fa1de2e77dd0c2f07fd58MD54open access2002_Presentación_de_informe_Pinzon_Ardila_Yoan_José.pdf.jpg2002_Presentación_de_informe_Pinzon_Ardila_Yoan_José.pdf.jpgIM Thumbnailimage/jpeg12228https://repository.unab.edu.co/bitstream/20.500.12749/23883/5/2002_Presentaci%c3%b3n_de_informe_Pinzon_Ardila_Yoan_Jos%c3%a9.pdf.jpg013e31a900a1697c5a881e98f1d59532MD55open access20.500.12749/23883oai:repository.unab.edu.co:20.500.12749/238832024-03-08 22:00:43.836open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbi4gRWwgQVVUT1IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBlbiBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVTkFCIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8gZGUgYnVlbmEgZmUuCgpFbCBBVVRPUiBhdXRvcml6YSBhIGxhIFVuaXZlcnNpZGFkIEF1dMOzbm9tYSBkZSBCdWNhcmFtYW5nYSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24uCg== |