Aceleración de consultas en sistemas de bases de datos distribuidas

El advenimiento de la era de las telecomunicaciones y el desarrollo constante de hardware y estructuras de red han fomentado la descentralización de datos al tiempo que aumentan las necesidades de acceder a información desde diferentes sitios. Las estrategias de optimización de consultas tienen como...

Full description

Autores:
Haraty, Ramzi A.
Fany, Roula C.
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2001
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/9078
Acceso en línea:
http://hdl.handle.net/20.500.12749/9078
Palabra clave:
Innovaciones tecnológicas
Ciencia de los computadores
Desarrollo de tecnología
Ingeniería de sistemas
Investigaciones
Tecnologías de la información y las comunicaciones
TIC´s
Technological innovations
Computer science
Technology development
Systems engineering
Investigations
Information and communication technologies
ICT's
Query acceleration
PERF Joins and semi joins
Sistemas de información documental
Transmisión de datos
Aceleración de consultas
Combinaciones PERF y semiuniones
Rights
License
Derechos de autor 2001 Revista Colombiana de Computación
id UNAB2_2d75b026c8e935ad555b7aa8be32656b
oai_identifier_str oai:repository.unab.edu.co:20.500.12749/9078
network_acronym_str UNAB2
network_name_str Repositorio UNAB
repository_id_str
dc.title.none.fl_str_mv Aceleración de consultas en sistemas de bases de datos distribuidas
dc.title.translated.none.fl_str_mv Query acceleration in distributed database systems
title Aceleración de consultas en sistemas de bases de datos distribuidas
spellingShingle Aceleración de consultas en sistemas de bases de datos distribuidas
Innovaciones tecnológicas
Ciencia de los computadores
Desarrollo de tecnología
Ingeniería de sistemas
Investigaciones
Tecnologías de la información y las comunicaciones
TIC´s
Technological innovations
Computer science
Technology development
Systems engineering
Investigations
Information and communication technologies
ICT's
Query acceleration
PERF Joins and semi joins
Sistemas de información documental
Transmisión de datos
Aceleración de consultas
Combinaciones PERF y semiuniones
title_short Aceleración de consultas en sistemas de bases de datos distribuidas
title_full Aceleración de consultas en sistemas de bases de datos distribuidas
title_fullStr Aceleración de consultas en sistemas de bases de datos distribuidas
title_full_unstemmed Aceleración de consultas en sistemas de bases de datos distribuidas
title_sort Aceleración de consultas en sistemas de bases de datos distribuidas
dc.creator.fl_str_mv Haraty, Ramzi A.
Fany, Roula C.
dc.contributor.author.spa.fl_str_mv Haraty, Ramzi A.
Fany, Roula C.
dc.subject.none.fl_str_mv Innovaciones tecnológicas
Ciencia de los computadores
Desarrollo de tecnología
Ingeniería de sistemas
Investigaciones
Tecnologías de la información y las comunicaciones
TIC´s
topic Innovaciones tecnológicas
Ciencia de los computadores
Desarrollo de tecnología
Ingeniería de sistemas
Investigaciones
Tecnologías de la información y las comunicaciones
TIC´s
Technological innovations
Computer science
Technology development
Systems engineering
Investigations
Information and communication technologies
ICT's
Query acceleration
PERF Joins and semi joins
Sistemas de información documental
Transmisión de datos
Aceleración de consultas
Combinaciones PERF y semiuniones
dc.subject.keywords.eng.fl_str_mv Technological innovations
Computer science
Technology development
Systems engineering
Investigations
Information and communication technologies
ICT's
dc.subject.keywords.none.fl_str_mv Query acceleration
PERF Joins and semi joins
dc.subject.lemb.none.fl_str_mv Sistemas de información documental
Transmisión de datos
dc.subject.proposal.none.fl_str_mv Aceleración de consultas
Combinaciones PERF y semiuniones
description El advenimiento de la era de las telecomunicaciones y el desarrollo constante de hardware y estructuras de red han fomentado la descentralización de datos al tiempo que aumentan las necesidades de acceder a información desde diferentes sitios. Las estrategias de optimización de consultas tienen como objetivo minimizar el costo de transferir datos a través de las redes. Se han propuesto muchas técnicas y algoritmos para optimizar las consultas. Quizás uno de los algoritmos más importantes es el algoritmo AHY que usa semiuniones que es implementado por Apers, Hevner y Yao en [1]. Hoy en día, una nueva técnica llamada PERF (Filtros de registro parcialmente codificados) parece traer alguna mejora con respecto a las semiuniones [12]. Las uniones PERF son semiuniones bidireccionales que utilizan un vector de bits como fase hacia atrás. Nuestra investigación abarca la aplicación de combinaciones PERF a dos algoritmos bien conocidos: AHY y W, que se ocupan de la optimización de consultas. Los programas se diseñaron para implementar tanto el algoritmo original como el mejorado. Se realizaron varios experimentos y los resultados mostraron una mejora muy considerable obtenida mediante la aplicación del concepto PERF. Esta importante mejora nos llevó a realizar más observaciones y estudios.
publishDate 2001
dc.date.issued.none.fl_str_mv 2001-06-01
dc.date.accessioned.none.fl_str_mv 2020-10-27T00:21:38Z
dc.date.available.none.fl_str_mv 2020-10-27T00:21:38Z
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/article
dc.type.local.spa.fl_str_mv Artículo
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/CJournalArticle
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.issn.none.fl_str_mv 2539-2115
1657-2831
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12749/9078
dc.identifier.instname.spa.fl_str_mv instname:Universidad Autónoma de Bucaramanga UNAB
dc.identifier.repourl.none.fl_str_mv repourl:https://repository.unab.edu.co
identifier_str_mv 2539-2115
1657-2831
instname:Universidad Autónoma de Bucaramanga UNAB
repourl:https://repository.unab.edu.co
url http://hdl.handle.net/20.500.12749/9078
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv https://revistas.unab.edu.co/index.php/rcc/article/view/1119/1090
dc.relation.uri.none.fl_str_mv https://revistas.unab.edu.co/index.php/rcc/article/view/1119
dc.relation.uri.spa.fl_str_mv http://hdl.handle.net/20.500.12749/20207
dc.relation.references.none.fl_str_mv Apers, P., Hevner, A., and Yao, A. Optimization Algorithms For Distributed Queries in IEEE Transactions on Software Engineering, Vol. Se-9, No.1. 1983. pp. 57-68
Barbara, D., DuMouchel, W., Faloustos, C., Haas, P. J., Hellerstein, J., Iaonnidies, Y., Jagadish, H., Johnson, T., Ng, R., Poosala, N., Ross, K., and Sevcik, K. The New Jersey Data Reduction Report. Bulletin of the Technical Committee on Data Engineering, 1997. pp. 3-45
Bealor, T. Semi-Join Strategies For Total Cost Minimization in Distributed Query Processing. Master Thesis, University of Windsor, Canada. 1995
Bernstein, P., Goodman, N., Wong, E., Reeve, C., and Rothnie, J. Query Processing in a System For Distributed Databases (SDD-1) in ACM Transactions on Database Systems, Vol. 6, No. 4. 1981. pp. 602-625
Chatziantoniou, D., and Ross, K. GroupWise Processing of Relational Queries in Proceedings of the 1997 VLDB Conference, 1997. pp. 476-485
Chen, A., and Li, V. Improvement Algorithms For Semi-join Query Processing Programs In Distributed Database Systems in IEEE Transactions on Computers, Vol. C-33, No.11, 1984. pp. 959-967
Hevner, A., Wu, O., and Yao, S. Query Optimization on Local Area Networks in ACM Transactions on Office Information, Vol. 3, No. 1, 1985. pp. 35-62
Kang, H., and Roussopoulos, N. Using 2-Way Semi-joins in Distributed Query Processing in Proceedings of the Third International Conference on Data Engineering, 1987. pp. 644-651
Karwin, B. InterBase Server Configuration And Optimization. Borland Developer’s Conference. 1996
Lei, H., and Ross, K. Faster Joins, Self-Joins and Multi-Way Joins Using Join Indices in International Workshop on Next Generation Information Technologies and Systems. 1997
Levy, A., Srivastava, D., and Kirk, T. Data Model and Query Evaluation in Global Information Systems. AT&T Bell Laboratories. 1991
Li, Z., and Ross, K. PERF Join: An Alternative to Two-Way Semi-Join and Bloomjoin. Technical Report. Columbia University, New York. 1995
Li, Z., and Ross, K. Fast Joins Using Join Indices in VLDB Journal, Vol. 8, No. 1, 1999. pp. 6-12
Liu, C., and Chen, H. A Hash Partition Strategy for Distributed Query Processing. Technical Report. De Paul University, Chicago. 1995.
dc.rights.none.fl_str_mv Derechos de autor 2001 Revista Colombiana de Computación
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.creativecommons.*.fl_str_mv Attribution-NonCommercial-ShareAlike 4.0 International
rights_invalid_str_mv Derechos de autor 2001 Revista Colombiana de Computación
http://creativecommons.org/licenses/by-nc-sa/4.0/
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Attribution-NonCommercial-ShareAlike 4.0 International
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.publisher.faculty.none.fl_str_mv Facultad Ingeniería
dc.publisher.program.none.fl_str_mv Pregrado Ingeniería de Sistemas
publisher.none.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.source.none.fl_str_mv Revista Colombiana de Computación; Vol. 2 Núm. 1 (2001): Revista Colombiana de Computación; 19-34
institution Universidad Autónoma de Bucaramanga - UNAB
bitstream.url.fl_str_mv https://repository.unab.edu.co/bitstream/20.500.12749/9078/1/2001_Aceleraci%c3%b3n_de_consultas_en_sistemas_de_bases.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/9078/2/2001_Aceleraci%c3%b3n_de_consultas_en_sistemas_de_bases.pdf.jpg
bitstream.checksum.fl_str_mv d3560970231f3e3a87a047dfc8ec4603
9893bb935a18655922904daa82220866
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB
repository.mail.fl_str_mv repositorio@unab.edu.co
_version_ 1814277828067196928
spelling Haraty, Ramzi A.68edf43f-0c51-4f76-9209-e0e4cb177163Fany, Roula C.f36f384d-07db-4b42-aa75-33573e67d5192020-10-27T00:21:38Z2020-10-27T00:21:38Z2001-06-012539-21151657-2831http://hdl.handle.net/20.500.12749/9078instname:Universidad Autónoma de Bucaramanga UNABrepourl:https://repository.unab.edu.coEl advenimiento de la era de las telecomunicaciones y el desarrollo constante de hardware y estructuras de red han fomentado la descentralización de datos al tiempo que aumentan las necesidades de acceder a información desde diferentes sitios. Las estrategias de optimización de consultas tienen como objetivo minimizar el costo de transferir datos a través de las redes. Se han propuesto muchas técnicas y algoritmos para optimizar las consultas. Quizás uno de los algoritmos más importantes es el algoritmo AHY que usa semiuniones que es implementado por Apers, Hevner y Yao en [1]. Hoy en día, una nueva técnica llamada PERF (Filtros de registro parcialmente codificados) parece traer alguna mejora con respecto a las semiuniones [12]. Las uniones PERF son semiuniones bidireccionales que utilizan un vector de bits como fase hacia atrás. Nuestra investigación abarca la aplicación de combinaciones PERF a dos algoritmos bien conocidos: AHY y W, que se ocupan de la optimización de consultas. Los programas se diseñaron para implementar tanto el algoritmo original como el mejorado. Se realizaron varios experimentos y los resultados mostraron una mejora muy considerable obtenida mediante la aplicación del concepto PERF. Esta importante mejora nos llevó a realizar más observaciones y estudios.The advent of telecommunication era and the constant development of hardware and network structures have encouraged the decentralization of data while increasing the needs to access information from different sites. Query optimization strategies aim to minimize the cost of transferring data across networks. Many techniques and algorithms have been proposed to optimize queries. Perhaps one of the more important algorithms is the AHY algorithm using semi-joins that is implemented by Apers, Hevner and Yao in [1]. Nowadays, a new technique called PERF (Partially Encoded Record Filters) seems to bring some improvement over semi-joins [12]. PERF joins are two-way semi-joins using a bit vector as their backward phase. Our research encompasses applying PERF joins to two well know algorithms: AHY and W, which both deal with query optimization. Programs were designed to implement both the original and the enhanced algorithms. Several experiments were conducted and the results showed a very considerable enhancement obtained by applying the PERF concept. This major improvement led us to further observations and studies.application/pdfspaUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaPregrado Ingeniería de Sistemashttps://revistas.unab.edu.co/index.php/rcc/article/view/1119/1090https://revistas.unab.edu.co/index.php/rcc/article/view/1119http://hdl.handle.net/20.500.12749/20207Apers, P., Hevner, A., and Yao, A. Optimization Algorithms For Distributed Queries in IEEE Transactions on Software Engineering, Vol. Se-9, No.1. 1983. pp. 57-68Barbara, D., DuMouchel, W., Faloustos, C., Haas, P. J., Hellerstein, J., Iaonnidies, Y., Jagadish, H., Johnson, T., Ng, R., Poosala, N., Ross, K., and Sevcik, K. The New Jersey Data Reduction Report. Bulletin of the Technical Committee on Data Engineering, 1997. pp. 3-45Bealor, T. Semi-Join Strategies For Total Cost Minimization in Distributed Query Processing. Master Thesis, University of Windsor, Canada. 1995Bernstein, P., Goodman, N., Wong, E., Reeve, C., and Rothnie, J. Query Processing in a System For Distributed Databases (SDD-1) in ACM Transactions on Database Systems, Vol. 6, No. 4. 1981. pp. 602-625Chatziantoniou, D., and Ross, K. GroupWise Processing of Relational Queries in Proceedings of the 1997 VLDB Conference, 1997. pp. 476-485Chen, A., and Li, V. Improvement Algorithms For Semi-join Query Processing Programs In Distributed Database Systems in IEEE Transactions on Computers, Vol. C-33, No.11, 1984. pp. 959-967Hevner, A., Wu, O., and Yao, S. Query Optimization on Local Area Networks in ACM Transactions on Office Information, Vol. 3, No. 1, 1985. pp. 35-62Kang, H., and Roussopoulos, N. Using 2-Way Semi-joins in Distributed Query Processing in Proceedings of the Third International Conference on Data Engineering, 1987. pp. 644-651Karwin, B. InterBase Server Configuration And Optimization. Borland Developer’s Conference. 1996Lei, H., and Ross, K. Faster Joins, Self-Joins and Multi-Way Joins Using Join Indices in International Workshop on Next Generation Information Technologies and Systems. 1997Levy, A., Srivastava, D., and Kirk, T. Data Model and Query Evaluation in Global Information Systems. AT&T Bell Laboratories. 1991Li, Z., and Ross, K. PERF Join: An Alternative to Two-Way Semi-Join and Bloomjoin. Technical Report. Columbia University, New York. 1995Li, Z., and Ross, K. Fast Joins Using Join Indices in VLDB Journal, Vol. 8, No. 1, 1999. pp. 6-12Liu, C., and Chen, H. A Hash Partition Strategy for Distributed Query Processing. Technical Report. De Paul University, Chicago. 1995.Derechos de autor 2001 Revista Colombiana de Computaciónhttp://creativecommons.org/licenses/by-nc-sa/4.0/http://creativecommons.org/licenses/by-nc-nd/2.5/co/Attribution-NonCommercial-ShareAlike 4.0 Internationalhttp://purl.org/coar/access_right/c_abf2Revista Colombiana de Computación; Vol. 2 Núm. 1 (2001): Revista Colombiana de Computación; 19-34Innovaciones tecnológicasCiencia de los computadoresDesarrollo de tecnologíaIngeniería de sistemasInvestigacionesTecnologías de la información y las comunicacionesTIC´sTechnological innovationsComputer scienceTechnology developmentSystems engineeringInvestigationsInformation and communication technologiesICT'sQuery accelerationPERF Joins and semi joinsSistemas de información documentalTransmisión de datosAceleración de consultasCombinaciones PERF y semiunionesAceleración de consultas en sistemas de bases de datos distribuidasQuery acceleration in distributed database systemsinfo:eu-repo/semantics/articleArtículohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/redcol/resource_type/CJournalArticlehttp://purl.org/coar/version/c_970fb48d4fbd8a85ORIGINAL2001_Aceleración_de_consultas_en_sistemas_de_bases.pdf2001_Aceleración_de_consultas_en_sistemas_de_bases.pdfArticuloapplication/pdf169222https://repository.unab.edu.co/bitstream/20.500.12749/9078/1/2001_Aceleraci%c3%b3n_de_consultas_en_sistemas_de_bases.pdfd3560970231f3e3a87a047dfc8ec4603MD51open accessTHUMBNAIL2001_Aceleración_de_consultas_en_sistemas_de_bases.pdf.jpg2001_Aceleración_de_consultas_en_sistemas_de_bases.pdf.jpgIM Thumbnailimage/jpeg9257https://repository.unab.edu.co/bitstream/20.500.12749/9078/2/2001_Aceleraci%c3%b3n_de_consultas_en_sistemas_de_bases.pdf.jpg9893bb935a18655922904daa82220866MD52open access20.500.12749/9078oai:repository.unab.edu.co:20.500.12749/90782023-06-05 13:54:48.048open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.co