Filtrado eficiente de documentos XML con XPATH
El gran volumen de datos disponibles, gracias al desarrollo de internet y el crecimiento de la red hacen necesario el uso de aplicaciones de diseminación de información selectiva (SDI); para evitar abrumar a los usuarios con información innecesaria. Debido a esto surgen soluciones viables que llevan...
- Autores:
-
Piña Cañas, María Teresa
Lemus Zapata, Oscar Fernando
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2004
- Institución:
- Universidad Autónoma de Bucaramanga - UNAB
- Repositorio:
- Repositorio UNAB
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unab.edu.co:20.500.12749/26178
- Acceso en línea:
- http://hdl.handle.net/20.500.12749/26178
- Palabra clave:
- Systems engineer
Technological innovations
Selective information dissemination
Finite state machine
Information retrieval
XML (Document markup language)
Markup languages
Ingeniería de sistemas
Innovaciones tecnológicas
Recuperación de información
XML (Lenguaje de marcado)
Lenguajes de marcado
Diseminación de información selectiva
Máquina de estado finito
- Rights
- License
- http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Summary: | El gran volumen de datos disponibles, gracias al desarrollo de internet y el crecimiento de la red hacen necesario el uso de aplicaciones de diseminación de información selectiva (SDI); para evitar abrumar a los usuarios con información innecesaria. Debido a esto surgen soluciones viables que llevan a cabo la tarea de entregar al usuario la información requerida, previamente seleccionada y evaluada a través de diferentes técnicas, según sea el caso. Dentro de los mecanismos para la diseminación selectiva de información se encuentra las “Palabras Claves” como técnicas de recuperación. La llegada de XML usada para el intercambio de información y el desarrollo de lenguajes de sentencias (Xpath) para los datos de XML permite mecanismos de filtrado sofisticados que tenga en cuenta información de la estructura y no solo del contenido. Para lograr este filtrado existen mecanismos o algoritmos que lo hacen de manera eficientemente; se ha realizado un estudió teórico de varios de estos algoritmos que permiten filtrar documentos xml con expresiones Xpath, estos algoritmos son. XTrie, Xfilter, Yfilter e IBM Japón. Al aplicar los parámetros propuestos (facilidad de implementación, estructura, analizador, Y diversos aspectos con los experimentos realizados), con base en esto se ha podido determinar que el algoritmo Xfilter es el más apto para desarrollar el filtrado de los documentos por poseer una estructura basada en una Maquina de Estado Finito (MSF esta estructura permite la localización y examinación rápida de los perfiles pertenecientes a los documentos xml), que Se refleja en el QUERY INDEX permitiendo así hacer un casamiento de los documentos Xml y las sentencias Xpath además de usar un método llamado prefiltrado que permite eliminar cualquier sentencia que contiene UN nombre del elemento que no está presente en el documento entrante. |
---|