Modelo multidimensional espacio-temporal y lenguaje de consulta para temporadas

Una bodega de datos (BD) se modela usualmente mediante una vista multidimensional de los datos. En un modelo multidimensional, un conjunto de dimensiones se asocia con un tema de análisis denominado hecho. Cada dimensión se compone de un conjunto no vacío de niveles los cuales están organizados jerá...

Full description

Autores:
Moreno Arboleda, Francisco Javier
Tipo de recurso:
Doctoral thesis
Fecha de publicación:
2010
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/7259
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/7259
http://bdigital.unal.edu.co/3598/
Palabra clave:
0 Generalidades / Computer science, information and general works
Bases de datos temporales
Bases de datos multidimensionales
Tecnología OLAP
Análisis espacio-temporal
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:Una bodega de datos (BD) se modela usualmente mediante una vista multidimensional de los datos. En un modelo multidimensional, un conjunto de dimensiones se asocia con un tema de análisis denominado hecho. Cada dimensión se compone de un conjunto no vacío de niveles los cuales están organizados jerárquicamente. Usualmente, una dimensión se considera estática en una BD; sin embargo, el esquema y los datos de una dimensión pueden evolucionar. Esta tesis se enfoca en un tipo de cambio de datos dimensional conocido como reclasificación, es decir, cuando un miembro (instancia) de un nivel cambia de padre (un miembro de un nivel superior en la misma dimensión). La primera contribución de esta tesis es la concepción de un modelo temporal multidimensional formal, donde se soportan diferentes unidades temporales de reclasificación. Por ejemplo, los vendedores pueden ser contratados por las tiendas por períodos de días, mientras que las tiendas pueden ser cambiadas de categoría anualmente. Como segunda contribución, se presenta y formaliza el concepto de temporada, un intervalo durante el cual un miembro de un nivel está asociado con otro, y se proponen operadores de consulta que permiten la formulación de consultas de temporada. Por ejemplo, "¿Cuál fue el valor total vendido por un vendedor en su primera temporada en una tienda?" También se extienden las consultas de temporada con elementos espaciales permitiendo la formulación de consultas tales como "¿Cuál fue el valor total vendido por un vendedor en su enésima temporada en una región geográfica dada?" / Abstract: A data warehouse (DW) is usually modelled using a multidimensional view of data. In a multidimensional model a set of dimensions is associated with a subject of analysis called fact. Each dimension is composed of a non-empty set of levels which are organized hierarchically. Usually, a dimension is considered static in a DW; however, the dimension schema and dimension data can evolve. In this thesis, we focus on a type of dimension data change known as reclassification, i.e., when a member (instance) of a level changes its parent (a member of a higher level of the same dimension). The first contribution of this thesis is the development of a formal temporal multidimensional model, where different temporal units of reclassification are supported. For example, salespersons can be hired by stores for periods of days, whereas stores can be changed of status annually. As the second contribution, we introduce and formalize the notion of season, an interval during which a member of a level is associated with another one, and propose query language constructs to enable the formulation of season queries. For example, "What was the total value sold by a salesperson in his first season in a store?" We also extend season queries with spatial features enabling the formulation of queries such as "What was the total value sold by a salesperson in his nth season in a given geographic region?"