Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1
En la pandemia de Influenza A H1N1 del 2009, algunos pacientes que presentaban la sintomatología de infección por este virus eran diagnosticados como falsos negativos por la RT-PCR, debido a la ausencia en la polimerización de los genes para la Hemaglutinina (HA), Nucleocápside y las Proteínas de Ma...
- Autores:
-
Acuña Carvajal, Cristina Isabel
- Tipo de recurso:
- http://purl.org/coar/version/c_b1a7d7d4d402bcce
- Fecha de publicación:
- 2019
- Institución:
- Universidad Industrial de Santander
- Repositorio:
- Repositorio UIS
- Idioma:
- spa
- OAI Identifier:
- oai:noesis.uis.edu.co:20.500.14071/12714
- Palabra clave:
- Virus Influenza A H1N1
Bases De Datos
Bioinformática
Minería De Datos.
Influenza A H1N1 Virus
Databases
Bioinformatics
Big Data.
- Rights
- openAccess
- License
- Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
id |
UISANTADR2_c68777a5b882903ef9a2b32c69fc6987 |
---|---|
oai_identifier_str |
oai:noesis.uis.edu.co:20.500.14071/12714 |
network_acronym_str |
UISANTADR2 |
network_name_str |
Repositorio UIS |
repository_id_str |
|
dc.title.none.fl_str_mv |
Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1 |
dc.title.english.none.fl_str_mv |
Evaluation of a program for the generation of databases with sequences of the year 2017 of the influenza virus a h1n1 hemagglutinin gene* |
title |
Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1 |
spellingShingle |
Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1 Virus Influenza A H1N1 Bases De Datos Bioinformática Minería De Datos. Influenza A H1N1 Virus Databases Bioinformatics Big Data. |
title_short |
Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1 |
title_full |
Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1 |
title_fullStr |
Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1 |
title_full_unstemmed |
Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1 |
title_sort |
Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1 |
dc.creator.fl_str_mv |
Acuña Carvajal, Cristina Isabel |
dc.contributor.advisor.none.fl_str_mv |
Barrios Hernández, Carlos Jaime |
dc.contributor.author.none.fl_str_mv |
Acuña Carvajal, Cristina Isabel |
dc.subject.none.fl_str_mv |
Virus Influenza A H1N1 Bases De Datos Bioinformática Minería De Datos. |
topic |
Virus Influenza A H1N1 Bases De Datos Bioinformática Minería De Datos. Influenza A H1N1 Virus Databases Bioinformatics Big Data. |
dc.subject.keyword.none.fl_str_mv |
Influenza A H1N1 Virus Databases Bioinformatics Big Data. |
description |
En la pandemia de Influenza A H1N1 del 2009, algunos pacientes que presentaban la sintomatología de infección por este virus eran diagnosticados como falsos negativos por la RT-PCR, debido a la ausencia en la polimerización de los genes para la Hemaglutinina (HA), Nucleocápside y las Proteínas de Matriz M1 y M2. Con una base de datos que incluyó todas las secuencias genómicas hasta el año 2010 del virus, generada por 10 personas durante 18 meses, se determinó que el resultado fue debido a procesos evolutivos del genoma viral; por ello, fueron diseñados nuevos cebadores que diagnosticaron la infección en 150 pacientes. Para solucionar los tiempos de construcción de la base de datos, se generó el programa BioDataToolkit v1.0 cuyo objetivo fue obtener del GenBank: la fecha de colección, país, hospedero, organismo, segmento, serotipo, cepa, el número de acceso y el ORF de cada cepa, para ubicarlos por columnas en Excel, para manejar la información en minutos. Sin embargo, el programa no había sido determinado a nivel biológico, lo cual se realizó en esta pasantía con el gen HA del virus de Influenza A H1N1 del 2017. Se determinó que la combinación óptima para obtener la mayoría de las secuencias fue “Influenza a virus 4 segment h1n1 2017 complete CDS”; con ellas, se generó un formato GenBank full que empleó el programa para su análisis. Desde la versión 1.0 se generó la página de Excel, pero la información no permitía análisis biológicos por tanto los programadores realizaron las modificaciones requeridas en cada validación hasta generar la versión 5.0 la cual permite obtener la información de cada secuencia en columnas y los formatos Fasta en minutos, para la generación de secuencias consenso y análisis filogenéticos. Sin embargo, es necesario la generación de la v6.0 para concluir la optimización del programa BioDataToolkit. |
publishDate |
2019 |
dc.date.created.none.fl_str_mv |
2019 |
dc.date.issued.none.fl_str_mv |
2019 |
dc.date.accessioned.none.fl_str_mv |
2023-04-05T03:43:18Z |
dc.date.available.none.fl_str_mv |
2023 2023-04-05T03:43:18Z |
dc.type.local.none.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Pregrado |
dc.type.hasversion.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/version/c_b1a7d7d4d402bcce |
format |
http://purl.org/coar/version/c_b1a7d7d4d402bcce |
dc.identifier.uri.none.fl_str_mv |
https://noesis.uis.edu.co/handle/20.500.14071/12714 |
dc.identifier.instname.none.fl_str_mv |
Universidad Industrial de Santander |
dc.identifier.reponame.none.fl_str_mv |
Universidad Industrial de Santander |
dc.identifier.repourl.none.fl_str_mv |
https://noesis.uis.edu.co |
url |
https://noesis.uis.edu.co/handle/20.500.14071/12714 https://noesis.uis.edu.co |
identifier_str_mv |
Universidad Industrial de Santander |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.license.none.fl_str_mv |
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) |
dc.rights.uri.none.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.coar.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.accessrights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.creativecommons.none.fl_str_mv |
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) |
rights_invalid_str_mv |
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) http://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad Industrial de Santander |
dc.publisher.faculty.none.fl_str_mv |
Facultad de Ciencias |
dc.publisher.program.none.fl_str_mv |
Biología |
dc.publisher.school.none.fl_str_mv |
Escuela de Biología |
publisher.none.fl_str_mv |
Universidad Industrial de Santander |
institution |
Universidad Industrial de Santander |
bitstream.url.fl_str_mv |
https://noesis.uis.edu.co/bitstreams/5395c5ac-5905-4e4e-b4cf-29fbf990eca0/download https://noesis.uis.edu.co/bitstreams/3c1a620c-8663-418a-b47c-67da4dbfa310/download https://noesis.uis.edu.co/bitstreams/8553c9a5-95c9-415f-8b0c-01aa88efa0e6/download |
bitstream.checksum.fl_str_mv |
2fb5be73ada33b67e647ef7ceb576d3d f3dc8686567a29018cc4f3aa973a8c63 d01467dab57f0e2ed64dcbc8821eff60 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
DSpace at UIS |
repository.mail.fl_str_mv |
noesis@uis.edu.co |
_version_ |
1831929672348205056 |
spelling |
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_abf2info:eu-repo/semantics/openAccessAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)Barrios Hernández, Carlos JaimeAcuña Carvajal, Cristina Isabel2023-04-05T03:43:18Z20232023-04-05T03:43:18Z20192019https://noesis.uis.edu.co/handle/20.500.14071/12714Universidad Industrial de SantanderUniversidad Industrial de Santanderhttps://noesis.uis.edu.coEn la pandemia de Influenza A H1N1 del 2009, algunos pacientes que presentaban la sintomatología de infección por este virus eran diagnosticados como falsos negativos por la RT-PCR, debido a la ausencia en la polimerización de los genes para la Hemaglutinina (HA), Nucleocápside y las Proteínas de Matriz M1 y M2. Con una base de datos que incluyó todas las secuencias genómicas hasta el año 2010 del virus, generada por 10 personas durante 18 meses, se determinó que el resultado fue debido a procesos evolutivos del genoma viral; por ello, fueron diseñados nuevos cebadores que diagnosticaron la infección en 150 pacientes. Para solucionar los tiempos de construcción de la base de datos, se generó el programa BioDataToolkit v1.0 cuyo objetivo fue obtener del GenBank: la fecha de colección, país, hospedero, organismo, segmento, serotipo, cepa, el número de acceso y el ORF de cada cepa, para ubicarlos por columnas en Excel, para manejar la información en minutos. Sin embargo, el programa no había sido determinado a nivel biológico, lo cual se realizó en esta pasantía con el gen HA del virus de Influenza A H1N1 del 2017. Se determinó que la combinación óptima para obtener la mayoría de las secuencias fue “Influenza a virus 4 segment h1n1 2017 complete CDS”; con ellas, se generó un formato GenBank full que empleó el programa para su análisis. Desde la versión 1.0 se generó la página de Excel, pero la información no permitía análisis biológicos por tanto los programadores realizaron las modificaciones requeridas en cada validación hasta generar la versión 5.0 la cual permite obtener la información de cada secuencia en columnas y los formatos Fasta en minutos, para la generación de secuencias consenso y análisis filogenéticos. Sin embargo, es necesario la generación de la v6.0 para concluir la optimización del programa BioDataToolkit.PregradoBiólogoIn the pandemic Influenza A H1N1 of 2009, some patients who had the symptomatology of infection with this virus were diagnosed as negatives false by RT-PCR, due to the absence in polymerization of genes for Hemagglutinin (HA), Nucleocapsid (HA), and matrix proteins M1 and M2. With a database that included all genomic sequences up to the year 2010 of the virus, generated by 10 people for 18 months, it was determined that the result was due to evolutionary processes of the viral genome. Therefore, new primers that diagnosed the infection in 150 patients were designed. In order to solve the construction times of the database, the BioDataToolkit v1.0 program was generated whose objective was to obtain from GenBank: the collection date, country, host country, organism, segment, serotype, strain, the access number and ORF of each strain, to be placed by columns in Excel, to handle the information in minutes. However, the program had not been determined biologically, which was done in this internship with the HA gene of the Influenza A H1N1 virus of 2017. It was determined that the optimal combination to obtain most sequences was "Influenza a virus 4 Segment h1n1 2017 complete CDS"; with them, a full GenBank format was generated that used the program for analysis. Since version 1.0 the Excel page was generated but the information did not allow biological analysis. Therefore, the programmers made the modifications required in each validation until generating version 5.0 which allows to obtain the information of each sequence in columns and Fasta formats in minutes, for the generation of consensus sequences and phylogenetic analysis. However, the generation of the V6.0 is necessary to complete the optimization of the BioDataToolkit program.application/pdfspaUniversidad Industrial de SantanderFacultad de CienciasBiologíaEscuela de BiologíaVirus Influenza A H1N1Bases De DatosBioinformáticaMinería De Datos.Influenza A H1N1 VirusDatabasesBioinformaticsBig Data.Evaluación de un programa para la generacion de bases de datos con secuencias del año 2017 del gen de la hemaglutinina del virus de influenza a h1n1Evaluation of a program for the generation of databases with sequences of the year 2017 of the influenza virus a h1n1 hemagglutinin gene*Tesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_b1a7d7d4d402bcceORIGINALCarta de autorización.pdfapplication/pdf241810https://noesis.uis.edu.co/bitstreams/5395c5ac-5905-4e4e-b4cf-29fbf990eca0/download2fb5be73ada33b67e647ef7ceb576d3dMD51Documento.pdfapplication/pdf1875706https://noesis.uis.edu.co/bitstreams/3c1a620c-8663-418a-b47c-67da4dbfa310/downloadf3dc8686567a29018cc4f3aa973a8c63MD52Nota de proyecto.pdfapplication/pdf139088https://noesis.uis.edu.co/bitstreams/8553c9a5-95c9-415f-8b0c-01aa88efa0e6/downloadd01467dab57f0e2ed64dcbc8821eff60MD5320.500.14071/12714oai:noesis.uis.edu.co:20.500.14071/127142023-06-05 11:22:04.019http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessembargohttps://noesis.uis.edu.coDSpace at UISnoesis@uis.edu.co |