Filtrado eficiente de documentos XML con XPATH

El gran volumen de datos disponibles, gracias al desarrollo de internet y el crecimiento de la red hacen necesario el uso de aplicaciones de diseminación de información selectiva (SDI); para evitar abrumar a los usuarios con información innecesaria. Debido a esto surgen soluciones viables que llevan...

Full description

Autores:
Piña Cañas, María Teresa
Lemus Zapata, Oscar Fernando
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2004
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/26178
Acceso en línea:
http://hdl.handle.net/20.500.12749/26178
Palabra clave:
Systems engineer
Technological innovations
Selective information dissemination
Finite state machine
Information retrieval
XML (Document markup language)
Markup languages
Ingeniería de sistemas
Innovaciones tecnológicas
Recuperación de información
XML (Lenguaje de marcado)
Lenguajes de marcado
Diseminación de información selectiva
Máquina de estado finito
Rights
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Description
Summary:El gran volumen de datos disponibles, gracias al desarrollo de internet y el crecimiento de la red hacen necesario el uso de aplicaciones de diseminación de información selectiva (SDI); para evitar abrumar a los usuarios con información innecesaria. Debido a esto surgen soluciones viables que llevan a cabo la tarea de entregar al usuario la información requerida, previamente seleccionada y evaluada a través de diferentes técnicas, según sea el caso. Dentro de los mecanismos para la diseminación selectiva de información se encuentra las “Palabras Claves” como técnicas de recuperación. La llegada de XML usada para el intercambio de información y el desarrollo de lenguajes de sentencias (Xpath) para los datos de XML permite mecanismos de filtrado sofisticados que tenga en cuenta información de la estructura y no solo del contenido. Para lograr este filtrado existen mecanismos o algoritmos que lo hacen de manera eficientemente; se ha realizado un estudió teórico de varios de estos algoritmos que permiten filtrar documentos xml con expresiones Xpath, estos algoritmos son. XTrie, Xfilter, Yfilter e IBM Japón. Al aplicar los parámetros propuestos (facilidad de implementación, estructura, analizador, Y diversos aspectos con los experimentos realizados), con base en esto se ha podido determinar que el algoritmo Xfilter es el más apto para desarrollar el filtrado de los documentos por poseer una estructura basada en una Maquina de Estado Finito (MSF esta estructura permite la localización y examinación rápida de los perfiles pertenecientes a los documentos xml), que Se refleja en el QUERY INDEX permitiendo así hacer un casamiento de los documentos Xml y las sentencias Xpath además de usar un método llamado prefiltrado que permite eliminar cualquier sentencia que contiene UN nombre del elemento que no está presente en el documento entrante.