Sistema de Aprendizaje de Patrones de Navegación Web Mediante Gramáticas Probabilísticas de Hipertexto

Uno de los problemas que reviste real interés en el área de minería de uso de la web es capturar las actividades de los usuarios durante su conexión y extraer patrones de comportamiento que permitan definir sus preferencias con el fin de mejorar el diseño de futuras páginas adaptando las interfaces...

Full description

Autores:
Cortés Vásquez, Augusto Parcemon
Tipo de recurso:
Article of journal
Fecha de publicación:
2015
Institución:
Corporación Universidad de la Costa
Repositorio:
REDICUC - Repositorio CUC
Idioma:
spa
OAI Identifier:
oai:repositorio.cuc.edu.co:11323/12101
Acceso en línea:
https://hdl.handle.net/11323/12101
https://revistascientificas.cuc.edu.co/ingecuc/article/view/383
Palabra clave:
Gramáticas probabilísticas
patrones de navegación
aprendizaje de patrones
gramática probabilística de hipertexto
hipertexto
recuperación de información
Probabilistic Grammars
Navigation Patterns
Pattern Learning Hypertext Probabilistic Grammar
Hypertext
Information Retrieval
Rights
openAccess
License
INGE CUC - 2015
Description
Summary:Uno de los problemas que reviste real interés en el área de minería de uso de la web es capturar las actividades de los usuarios durante su conexión y extraer patrones de comportamiento que permitan definir sus preferencias con el fin de mejorar el diseño de futuras páginas adaptando las interfaces de los sitios web a los usuarios individuales., En esta investigación se pretende ofrecer en primer lugar una presentación de los fundamentos metodológicos del uso de lenguajes probabilísticos para identificar sitios web más relevantes o visitados. En segundo lugar se representa las sesiones web mediante grafos y gramáticas libres de contexto probabilísticas de tal forma que las sesiones que tengan mayor probabilidad son consideradas las más visitadas o más preferidas, por tanto las más relevantes en relación a un tópico determinado. Se pretende desarrollar una herramienta para procesamiento de sesiones web obtenidas a partir de log de servidor representado mediante gramáticas probabilísticas libres de contexto.