Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1

En la pandemia de Influenza A H1N1 del 2009, algunos pacientes que presentaban la sintomatología de infección por este virus eran diagnosticados como falsos negativos por la RT-PCR, debido a la ausencia en la polimerización de los genes para la Hemaglutinina (HA), Nucleocápside y las Proteínas de Ma...

Full description

Autores:
Acuña Carvajal, Cristina Isabel
Tipo de recurso:
http://purl.org/coar/version/c_b1a7d7d4d402bcce
Fecha de publicación:
2019
Institución:
Universidad Industrial de Santander
Repositorio:
Repositorio UIS
Idioma:
spa
OAI Identifier:
oai:noesis.uis.edu.co:20.500.14071/12714
Acceso en línea:
https://noesis.uis.edu.co/handle/20.500.14071/12714
https://noesis.uis.edu.co
Palabra clave:
Virus Influenza A H1N1
Bases De Datos
Bioinformática
Minería De Datos.
Influenza A H1N1 Virus
Databases
Bioinformatics
Big Data.
Rights
openAccess
License
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
id UISANTADR2_c68777a5b882903ef9a2b32c69fc6987
oai_identifier_str oai:noesis.uis.edu.co:20.500.14071/12714
network_acronym_str UISANTADR2
network_name_str Repositorio UIS
repository_id_str
dc.title.none.fl_str_mv Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1
dc.title.english.none.fl_str_mv Evaluation of a program for the generation of databases with sequences of the year 2017 of the influenza virus a h1n1 hemagglutinin gene*
title Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1
spellingShingle Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1
Virus Influenza A H1N1
Bases De Datos
Bioinformática
Minería De Datos.
Influenza A H1N1 Virus
Databases
Bioinformatics
Big Data.
title_short Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1
title_full Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1
title_fullStr Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1
title_full_unstemmed Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1
title_sort Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1
dc.creator.fl_str_mv Acuña Carvajal, Cristina Isabel
dc.contributor.advisor.none.fl_str_mv Barrios Hernández, Carlos Jaime
dc.contributor.author.none.fl_str_mv Acuña Carvajal, Cristina Isabel
dc.subject.none.fl_str_mv Virus Influenza A H1N1
Bases De Datos
Bioinformática
Minería De Datos.
topic Virus Influenza A H1N1
Bases De Datos
Bioinformática
Minería De Datos.
Influenza A H1N1 Virus
Databases
Bioinformatics
Big Data.
dc.subject.keyword.none.fl_str_mv Influenza A H1N1 Virus
Databases
Bioinformatics
Big Data.
description En la pandemia de Influenza A H1N1 del 2009, algunos pacientes que presentaban la sintomatología de infección por este virus eran diagnosticados como falsos negativos por la RT-PCR, debido a la ausencia en la polimerización de los genes para la Hemaglutinina (HA), Nucleocápside y las Proteínas de Matriz M1 y M2. Con una base de datos que incluyó todas las secuencias genómicas hasta el año 2010 del virus, generada por 10 personas durante 18 meses, se determinó que el resultado fue debido a procesos evolutivos del genoma viral; por ello, fueron diseñados nuevos cebadores que diagnosticaron la infección en 150 pacientes. Para solucionar los tiempos de construcción de la base de datos, se generó el programa BioDataToolkit v1.0 cuyo objetivo fue obtener del GenBank: la fecha de colección, país, hospedero, organismo, segmento, serotipo, cepa, el número de acceso y el ORF de cada cepa, para ubicarlos por columnas en Excel, para manejar la información en minutos. Sin embargo, el programa no había sido determinado a nivel biológico, lo cual se realizó en esta pasantía con el gen HA del virus de Influenza A H1N1 del 2017. Se determinó que la combinación óptima para obtener la mayoría de las secuencias fue “Influenza a virus 4 segment h1n1 2017 complete CDS”; con ellas, se generó un formato GenBank full que empleó el programa para su análisis. Desde la versión 1.0 se generó la página de Excel, pero la información no permitía análisis biológicos por tanto los programadores realizaron las modificaciones requeridas en cada validación hasta generar la versión 5.0 la cual permite obtener la información de cada secuencia en columnas y los formatos Fasta en minutos, para la generación de secuencias consenso y análisis filogenéticos. Sin embargo, es necesario la generación de la v6.0 para concluir la optimización del programa BioDataToolkit.
publishDate 2019
dc.date.created.none.fl_str_mv 2019
dc.date.issued.none.fl_str_mv 2019
dc.date.accessioned.none.fl_str_mv 2023-04-05T03:43:18Z
dc.date.available.none.fl_str_mv 2023
2023-04-05T03:43:18Z
dc.type.local.none.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.hasversion.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.coar.none.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
format http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.identifier.uri.none.fl_str_mv https://noesis.uis.edu.co/handle/20.500.14071/12714
dc.identifier.instname.none.fl_str_mv Universidad Industrial de Santander
dc.identifier.reponame.none.fl_str_mv Universidad Industrial de Santander
dc.identifier.repourl.none.fl_str_mv https://noesis.uis.edu.co
url https://noesis.uis.edu.co/handle/20.500.14071/12714
https://noesis.uis.edu.co
identifier_str_mv Universidad Industrial de Santander
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.license.none.fl_str_mv Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.creativecommons.none.fl_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
rights_invalid_str_mv Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
eu_rights_str_mv openAccess
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Industrial de Santander
dc.publisher.faculty.none.fl_str_mv Facultad de Ciencias
dc.publisher.program.none.fl_str_mv Biología
dc.publisher.school.none.fl_str_mv Escuela de Biología
publisher.none.fl_str_mv Universidad Industrial de Santander
institution Universidad Industrial de Santander
bitstream.url.fl_str_mv https://noesis.uis.edu.co/bitstreams/5395c5ac-5905-4e4e-b4cf-29fbf990eca0/download
https://noesis.uis.edu.co/bitstreams/3c1a620c-8663-418a-b47c-67da4dbfa310/download
https://noesis.uis.edu.co/bitstreams/8553c9a5-95c9-415f-8b0c-01aa88efa0e6/download
bitstream.checksum.fl_str_mv 2fb5be73ada33b67e647ef7ceb576d3d
f3dc8686567a29018cc4f3aa973a8c63
d01467dab57f0e2ed64dcbc8821eff60
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv DSpace at UIS
repository.mail.fl_str_mv noesis@uis.edu.co
_version_ 1831929672348205056
spelling Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_abf2info:eu-repo/semantics/openAccessAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)Barrios Hernández, Carlos JaimeAcuña Carvajal, Cristina Isabel2023-04-05T03:43:18Z20232023-04-05T03:43:18Z20192019https://noesis.uis.edu.co/handle/20.500.14071/12714Universidad Industrial de SantanderUniversidad Industrial de Santanderhttps://noesis.uis.edu.coEn la pandemia de Influenza A H1N1 del 2009, algunos pacientes que presentaban la sintomatología de infección por este virus eran diagnosticados como falsos negativos por la RT-PCR, debido a la ausencia en la polimerización de los genes para la Hemaglutinina (HA), Nucleocápside y las Proteínas de Matriz M1 y M2. Con una base de datos que incluyó todas las secuencias genómicas hasta el año 2010 del virus, generada por 10 personas durante 18 meses, se determinó que el resultado fue debido a procesos evolutivos del genoma viral; por ello, fueron diseñados nuevos cebadores que diagnosticaron la infección en 150 pacientes. Para solucionar los tiempos de construcción de la base de datos, se generó el programa BioDataToolkit v1.0 cuyo objetivo fue obtener del GenBank: la fecha de colección, país, hospedero, organismo, segmento, serotipo, cepa, el número de acceso y el ORF de cada cepa, para ubicarlos por columnas en Excel, para manejar la información en minutos. Sin embargo, el programa no había sido determinado a nivel biológico, lo cual se realizó en esta pasantía con el gen HA del virus de Influenza A H1N1 del 2017. Se determinó que la combinación óptima para obtener la mayoría de las secuencias fue “Influenza a virus 4 segment h1n1 2017 complete CDS”; con ellas, se generó un formato GenBank full que empleó el programa para su análisis. Desde la versión 1.0 se generó la página de Excel, pero la información no permitía análisis biológicos por tanto los programadores realizaron las modificaciones requeridas en cada validación hasta generar la versión 5.0 la cual permite obtener la información de cada secuencia en columnas y los formatos Fasta en minutos, para la generación de secuencias consenso y análisis filogenéticos. Sin embargo, es necesario la generación de la v6.0 para concluir la optimización del programa BioDataToolkit.PregradoBiólogoIn the pandemic Influenza A H1N1 of 2009, some patients who had the symptomatology of infection with this virus were diagnosed as negatives false by RT-PCR, due to the absence in polymerization of genes for Hemagglutinin (HA), Nucleocapsid (HA), and matrix proteins M1 and M2. With a database that included all genomic sequences up to the year 2010 of the virus, generated by 10 people for 18 months, it was determined that the result was due to evolutionary processes of the viral genome. Therefore, new primers that diagnosed the infection in 150 patients were designed. In order to solve the construction times of the database, the BioDataToolkit v1.0 program was generated whose objective was to obtain from GenBank: the collection date, country, host country, organism, segment, serotype, strain, the access number and ORF of each strain, to be placed by columns in Excel, to handle the information in minutes. However, the program had not been determined biologically, which was done in this internship with the HA gene of the Influenza A H1N1 virus of 2017. It was determined that the optimal combination to obtain most sequences was "Influenza a virus 4 Segment h1n1 2017 complete CDS"; with them, a full GenBank format was generated that used the program for analysis. Since version 1.0 the Excel page was generated but the information did not allow biological analysis. Therefore, the programmers made the modifications required in each validation until generating version 5.0 which allows to obtain the information of each sequence in columns and Fasta formats in minutes, for the generation of consensus sequences and phylogenetic analysis. However, the generation of the V6.0 is necessary to complete the optimization of the BioDataToolkit program.application/pdfspaUniversidad Industrial de SantanderFacultad de CienciasBiologíaEscuela de BiologíaVirus Influenza A H1N1Bases De DatosBioinformáticaMinería De Datos.Influenza A H1N1 VirusDatabasesBioinformaticsBig Data.Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1Evaluation of a program for the generation of databases with sequences of the year 2017 of the influenza virus a h1n1 hemagglutinin gene*Tesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_b1a7d7d4d402bcceORIGINALCarta de autorización.pdfapplication/pdf241810https://noesis.uis.edu.co/bitstreams/5395c5ac-5905-4e4e-b4cf-29fbf990eca0/download2fb5be73ada33b67e647ef7ceb576d3dMD51Documento.pdfapplication/pdf1875706https://noesis.uis.edu.co/bitstreams/3c1a620c-8663-418a-b47c-67da4dbfa310/downloadf3dc8686567a29018cc4f3aa973a8c63MD52Nota de proyecto.pdfapplication/pdf139088https://noesis.uis.edu.co/bitstreams/8553c9a5-95c9-415f-8b0c-01aa88efa0e6/downloadd01467dab57f0e2ed64dcbc8821eff60MD5320.500.14071/12714oai:noesis.uis.edu.co:20.500.14071/127142023-06-05 11:22:04.019http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessembargohttps://noesis.uis.edu.coDSpace at UISnoesis@uis.edu.co