Diseño e implementación de una arquitectura para un motor de búsqueda web de publicaciones científicas almacenadas en CvLAC.
ScienTI es una plataforma creada por Colciencias donde se almacena y consulta la información de toda la producción académica de instituciones, investigadores y grupos de investigación registrados en Colciencias. Sin embargo, dicha plataforma presenta errores de disponibilidad y usabilidad. Por ejemp...
- Autores:
-
Salas Taborda, Daniel Fernando
- Tipo de recurso:
- Fecha de publicación:
- 2017
- Institución:
- Universidad del Norte
- Repositorio:
- Repositorio Uninorte
- Idioma:
- spa
- OAI Identifier:
- oai:manglar.uninorte.edu.co:10584/7812
- Acceso en línea:
- http://hdl.handle.net/10584/7812
- Palabra clave:
- ArañaWeb
ScienTI
WebSpider
WebCrawler
- Rights
- License
- Universidad del Norte
Summary: | ScienTI es una plataforma creada por Colciencias donde se almacena y consulta la información de toda la producción académica de instituciones, investigadores y grupos de investigación registrados en Colciencias. Sin embargo, dicha plataforma presenta errores de disponibilidad y usabilidad. Por ejemplo, si se desea buscar un investigador en específico es necesario saber el grupo de investigación al que pertenece, porque los resultados de la búsqueda son grupos en los cuales algunos integrantes concuerdan con el nombre buscado. Otro problema que aqueja el normal funcionamiento de la plataforma es la caída constante de sus servidores que impide acceder a la información deseada. Teniendo en cuenta esta problemática este proyecto tiene como objetivo diseñar una arquitectura para un motor de búsqueda web que facilite la consulta de publicaciones científicas registradas en ScienTI. Para obtener la informacipon de ScienTI se utilizó un algoritmo WebScrapper y WebCrawler que analizara la página de ScienTI y envíe la información solicitada a la base de datos previamente diseñada. |
---|