Diseño e implementación de una arquitectura para un motor de búsqueda web de publicaciones científicas almacenadas en CvLAC.

ScienTI es una plataforma creada por Colciencias donde se almacena y consulta la información de toda la producción académica de instituciones, investigadores y grupos de investigación registrados en Colciencias. Sin embargo, dicha plataforma presenta errores de disponibilidad y usabilidad. Por ejemp...

Full description

Autores:
Salas Taborda, Daniel Fernando
Tipo de recurso:
Fecha de publicación:
2017
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/7812
Acceso en línea:
http://hdl.handle.net/10584/7812
Palabra clave:
ArañaWeb
ScienTI
WebSpider
WebCrawler
Rights
License
Universidad del Norte
Description
Summary:ScienTI es una plataforma creada por Colciencias donde se almacena y consulta la información de toda la producción académica de instituciones, investigadores y grupos de investigación registrados en Colciencias. Sin embargo, dicha plataforma presenta errores de disponibilidad y usabilidad. Por ejemplo, si se desea buscar un investigador en específico es necesario saber el grupo de investigación al que pertenece, porque los resultados de la búsqueda son grupos en los cuales algunos integrantes concuerdan con el nombre buscado. Otro problema que aqueja el normal funcionamiento de la plataforma es la caída constante de sus servidores que impide acceder a la información deseada. Teniendo en cuenta esta problemática este proyecto tiene como objetivo diseñar una arquitectura para un motor de búsqueda web que facilite la consulta de publicaciones científicas registradas en ScienTI. Para obtener la informacipon de ScienTI se utilizó un algoritmo WebScrapper y WebCrawler que analizara la página de ScienTI y envíe la información solicitada a la base de datos previamente diseñada.