Diseño e implementación de una arquitectura para un motor de búsqueda web de publicaciones científicas almacenadas en CvLAC.

ScienTI es una plataforma creada por Colciencias donde se almacena y consulta la información de toda la producción académica de instituciones, investigadores y grupos de investigación registrados en Colciencias. Sin embargo, dicha plataforma presenta errores de disponibilidad y usabilidad. Por ejemp...

Full description

Autores:
Salas Taborda, Daniel Fernando
Tipo de recurso:
Fecha de publicación:
2017
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/7812
Acceso en línea:
http://hdl.handle.net/10584/7812
Palabra clave:
ArañaWeb
ScienTI
WebSpider
WebCrawler
Rights
License
Universidad del Norte
id REPOUNORT2_bdcd92228ad71bd268b83f0b76e88ead
oai_identifier_str oai:manglar.uninorte.edu.co:10584/7812
network_acronym_str REPOUNORT2
network_name_str Repositorio Uninorte
repository_id_str
dc.title.es_ES.fl_str_mv Diseño e implementación de una arquitectura para un motor de búsqueda web de publicaciones científicas almacenadas en CvLAC.
dc.title.en_US.fl_str_mv Design and implementation of an architecture for a web search engine of scientific publications stored in CvLAC
title Diseño e implementación de una arquitectura para un motor de búsqueda web de publicaciones científicas almacenadas en CvLAC.
spellingShingle Diseño e implementación de una arquitectura para un motor de búsqueda web de publicaciones científicas almacenadas en CvLAC.
ArañaWeb
ScienTI
WebSpider
WebCrawler
title_short Diseño e implementación de una arquitectura para un motor de búsqueda web de publicaciones científicas almacenadas en CvLAC.
title_full Diseño e implementación de una arquitectura para un motor de búsqueda web de publicaciones científicas almacenadas en CvLAC.
title_fullStr Diseño e implementación de una arquitectura para un motor de búsqueda web de publicaciones científicas almacenadas en CvLAC.
title_full_unstemmed Diseño e implementación de una arquitectura para un motor de búsqueda web de publicaciones científicas almacenadas en CvLAC.
title_sort Diseño e implementación de una arquitectura para un motor de búsqueda web de publicaciones científicas almacenadas en CvLAC.
dc.creator.fl_str_mv Salas Taborda, Daniel Fernando
dc.contributor.advisor.none.fl_str_mv Estrada De La Hoz, Jesus David
dc.contributor.author.none.fl_str_mv Salas Taborda, Daniel Fernando
dc.subject.es_ES.fl_str_mv ArañaWeb
ScienTI
topic ArañaWeb
ScienTI
WebSpider
WebCrawler
dc.subject.en_US.fl_str_mv WebSpider
WebCrawler
description ScienTI es una plataforma creada por Colciencias donde se almacena y consulta la información de toda la producción académica de instituciones, investigadores y grupos de investigación registrados en Colciencias. Sin embargo, dicha plataforma presenta errores de disponibilidad y usabilidad. Por ejemplo, si se desea buscar un investigador en específico es necesario saber el grupo de investigación al que pertenece, porque los resultados de la búsqueda son grupos en los cuales algunos integrantes concuerdan con el nombre buscado. Otro problema que aqueja el normal funcionamiento de la plataforma es la caída constante de sus servidores que impide acceder a la información deseada. Teniendo en cuenta esta problemática este proyecto tiene como objetivo diseñar una arquitectura para un motor de búsqueda web que facilite la consulta de publicaciones científicas registradas en ScienTI. Para obtener la informacipon de ScienTI se utilizó un algoritmo WebScrapper y WebCrawler que analizara la página de ScienTI y envíe la información solicitada a la base de datos previamente diseñada.
publishDate 2017
dc.date.accessioned.none.fl_str_mv 2017-11-29T16:40:28Z
dc.date.available.none.fl_str_mv 2017-11-29T16:40:28Z
dc.date.issued.none.fl_str_mv 2017-11-29
dc.type.es_ES.fl_str_mv article
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10584/7812
url http://hdl.handle.net/10584/7812
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv Universidad del Norte
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Universidad del Norte
http://purl.org/coar/access_right/c_abf2
dc.publisher.es_ES.fl_str_mv Barranquilla, Universidad del Norte, 2017
institution Universidad del Norte
bitstream.url.fl_str_mv http://172.16.14.36:8080/bitstream/10584/7812/3/license.txt
http://172.16.14.36:8080/bitstream/10584/7812/1/DISENO%20E%20IMPLEMENTACON%20DE%20UNA%20ARQUITECTURA%20PARA%20UN%20MOTOR%20DE%20BUSQUEDA%20WEB%20DE%20PUBLICACIONES%20CIENTIFICAS%20ALMACENADAS%20EN%20CVLAC.jpg
http://172.16.14.36:8080/bitstream/10584/7812/2/DISENO%20E%20IMPLEMENTACON%20DE%20UNA%20ARQUITECTURA%20PARA%20UN%20MOTOR%20DE%20BUSQUEDA%20WEB%20DE%20PUBLICACIONES%20CIENTIFICAS%20ALMACENADAS%20EN%20CVLAC.pdf
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
2d36b8eecf442b39483fa74898208955
a4b683aa9ec178d9f618b38b6a0e094f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital de la Universidad del Norte
repository.mail.fl_str_mv mauribe@uninorte.edu.co
_version_ 1808401268473856000
spelling Estrada De La Hoz, Jesus DavidSalas Taborda, Daniel Fernando2017-11-29T16:40:28Z2017-11-29T16:40:28Z2017-11-29http://hdl.handle.net/10584/7812ScienTI es una plataforma creada por Colciencias donde se almacena y consulta la información de toda la producción académica de instituciones, investigadores y grupos de investigación registrados en Colciencias. Sin embargo, dicha plataforma presenta errores de disponibilidad y usabilidad. Por ejemplo, si se desea buscar un investigador en específico es necesario saber el grupo de investigación al que pertenece, porque los resultados de la búsqueda son grupos en los cuales algunos integrantes concuerdan con el nombre buscado. Otro problema que aqueja el normal funcionamiento de la plataforma es la caída constante de sus servidores que impide acceder a la información deseada. Teniendo en cuenta esta problemática este proyecto tiene como objetivo diseñar una arquitectura para un motor de búsqueda web que facilite la consulta de publicaciones científicas registradas en ScienTI. Para obtener la informacipon de ScienTI se utilizó un algoritmo WebScrapper y WebCrawler que analizara la página de ScienTI y envíe la información solicitada a la base de datos previamente diseñada.ScienTI is a platform developed by Colciencias. This platform has information about the entire academic production of institutions, researchers and research groups registered in Colciencias. However, this platform has availability and usability errors. For example, if you want to find a specific researcher it is necessary to know the research group him/her belongs to, because the results of the search are groups in which some members match with the name sought. Another problem that affects the normal functioning of the platform is the constant fall of its servers that prevents access to the desired information. Keeping in mind those problems, this project is created in order to design an architecture for a web search engine that facilitates searchs of scientific publications registered in ScienTI. In order to get the information for ScienTI website, we design a WebCrawler and WebScrapper algorithm for analize and get the information stored in the website. The next step is send that information to the database designed.spaBarranquilla, Universidad del Norte, 2017Universidad del Nortehttp://purl.org/coar/access_right/c_abf2ArañaWebScienTIWebSpiderWebCrawlerDiseño e implementación de una arquitectura para un motor de búsqueda web de publicaciones científicas almacenadas en CvLAC.Design and implementation of an architecture for a web search engine of scientific publications stored in CvLACarticlehttp://purl.org/coar/resource_type/c_6501LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://172.16.14.36:8080/bitstream/10584/7812/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53ORIGINALDISENO E IMPLEMENTACON DE UNA ARQUITECTURA PARA UN MOTOR DE BUSQUEDA WEB DE PUBLICACIONES CIENTIFICAS ALMACENADAS EN CVLAC.jpgDISENO E IMPLEMENTACON DE UNA ARQUITECTURA PARA UN MOTOR DE BUSQUEDA WEB DE PUBLICACIONES CIENTIFICAS ALMACENADAS EN CVLAC.jpgDISENO E IMPLEMENTACON DE UNA ARQUITECTURA PARA UN MOTOR DE BUSQUEDA WEB DE PUBLICACIONES CIENTIFICAS ALMACENADAS EN CVLACimage/jpeg86619http://172.16.14.36:8080/bitstream/10584/7812/1/DISENO%20E%20IMPLEMENTACON%20DE%20UNA%20ARQUITECTURA%20PARA%20UN%20MOTOR%20DE%20BUSQUEDA%20WEB%20DE%20PUBLICACIONES%20CIENTIFICAS%20ALMACENADAS%20EN%20CVLAC.jpg2d36b8eecf442b39483fa74898208955MD51DISENO E IMPLEMENTACON DE UNA ARQUITECTURA PARA UN MOTOR DE BUSQUEDA WEB DE PUBLICACIONES CIENTIFICAS ALMACENADAS EN CVLAC.pdfDISENO E IMPLEMENTACON DE UNA ARQUITECTURA PARA UN MOTOR DE BUSQUEDA WEB DE PUBLICACIONES CIENTIFICAS ALMACENADAS EN CVLAC.pdfDISENO E IMPLEMENTACON DE UNA ARQUITECTURA PARA UN MOTOR DE BUSQUEDA WEB DE PUBLICACIONES CIENTIFICAS ALMACENADAS EN CVLACapplication/pdf39755http://172.16.14.36:8080/bitstream/10584/7812/2/DISENO%20E%20IMPLEMENTACON%20DE%20UNA%20ARQUITECTURA%20PARA%20UN%20MOTOR%20DE%20BUSQUEDA%20WEB%20DE%20PUBLICACIONES%20CIENTIFICAS%20ALMACENADAS%20EN%20CVLAC.pdfa4b683aa9ec178d9f618b38b6a0e094fMD5210584/7812oai:172.16.14.36:10584/78122017-12-01 10:45:07.491Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.co