Tadava : visual analytics architecture for large table-based datasets

Visual Analytics provide the user with tools to process data in a very intuitive way. One of the challenges Visual Analytics faces nowadays is the need to represent big amounts of information in a way that the user can explore. This large amount of data can not be managed by conventional machines an...

Full description

Autores:
Ortiz Román, Juan Camilo
Tipo de recurso:
Fecha de publicación:
2018
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
eng
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/34912
Acceso en línea:
http://hdl.handle.net/1992/34912
Palabra clave:
Analítica visual - Investigaciones - Estudio de casos
Visualización de la información - Investigaciones
Arquitectura de software - Investigaciones
Software de aplicación - Investigaciones - Estudio de casos
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
id UNIANDES2_b8d9b8efef51b99d186cd91a519ea1b6
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/34912
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.es_CO.fl_str_mv Tadava : visual analytics architecture for large table-based datasets
title Tadava : visual analytics architecture for large table-based datasets
spellingShingle Tadava : visual analytics architecture for large table-based datasets
Analítica visual - Investigaciones - Estudio de casos
Visualización de la información - Investigaciones
Arquitectura de software - Investigaciones
Software de aplicación - Investigaciones - Estudio de casos
Ingeniería
title_short Tadava : visual analytics architecture for large table-based datasets
title_full Tadava : visual analytics architecture for large table-based datasets
title_fullStr Tadava : visual analytics architecture for large table-based datasets
title_full_unstemmed Tadava : visual analytics architecture for large table-based datasets
title_sort Tadava : visual analytics architecture for large table-based datasets
dc.creator.fl_str_mv Ortiz Román, Juan Camilo
dc.contributor.advisor.none.fl_str_mv Guerra Gómez, John Alexis
dc.contributor.author.none.fl_str_mv Ortiz Román, Juan Camilo
dc.contributor.jury.none.fl_str_mv Hernández Peñaloza, José Tiberio
Botero, Juan Felipe
dc.subject.keyword.es_CO.fl_str_mv Analítica visual - Investigaciones - Estudio de casos
Visualización de la información - Investigaciones
Arquitectura de software - Investigaciones
Software de aplicación - Investigaciones - Estudio de casos
topic Analítica visual - Investigaciones - Estudio de casos
Visualización de la información - Investigaciones
Arquitectura de software - Investigaciones
Software de aplicación - Investigaciones - Estudio de casos
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description Visual Analytics provide the user with tools to process data in a very intuitive way. One of the challenges Visual Analytics faces nowadays is the need to represent big amounts of information in a way that the user can explore. This large amount of data can not be managed by conventional machines and must be partitioned or underrepresented. Usually, visual analytics applications or widgets work with one single machine due to the requirements of low latency and quick interactions. This article presents Tadava, a visual analytics architecture based on representative sampling for large table-based datasets. Datasets samples are generated using systematics sampling and random sampling in order to obtain a collection of data from the original dataset. Experiments are made to determine the best sampling method to be used in datasets of different sizes, varying the step expected between samples. Tadava is built as a backend architecture for Navio, an interactive visualization widget for summarizing, exploring and navigating large datasets, and provides the widget with the capacity to manage table-based datasets between 400MB and 4GB.
publishDate 2018
dc.date.issued.none.fl_str_mv 2018
dc.date.accessioned.none.fl_str_mv 2020-06-10T09:26:17Z
dc.date.available.none.fl_str_mv 2020-06-10T09:26:17Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/34912
dc.identifier.pdf.none.fl_str_mv u820795.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/34912
identifier_str_mv u820795.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv eng
language eng
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 46 hojas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Uniandes
dc.publisher.program.es_CO.fl_str_mv Maestría en Ingeniería de Información
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ingeniería
dc.publisher.department.es_CO.fl_str_mv Departamento de Ingeniería de Sistemas y Computación
dc.source.es_CO.fl_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
instname_str Universidad de los Andes
institution Universidad de los Andes
reponame_str Repositorio Institucional Séneca
collection Repositorio Institucional Séneca
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/dbbb4103-7e93-4b39-a428-c0d9a9447b93/download
https://repositorio.uniandes.edu.co/bitstreams/fad4c855-2de9-4647-bc13-fcbdad13693b/download
https://repositorio.uniandes.edu.co/bitstreams/16a301b8-59a1-44fa-a4f0-808cddbfe179/download
bitstream.checksum.fl_str_mv 455d427d730a73d0d2c5d93b3e2d5846
118dd30f015006d08fbdc2b796b46597
3f336998f244d8023276a08d802883f5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133898309599232
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Guerra Gómez, John Alexisvirtual::6393-1Ortiz Román, Juan Camilodabba6bb-eb8b-4a2a-b278-b954c63b470c500Hernández Peñaloza, José TiberioBotero, Juan Felipe2020-06-10T09:26:17Z2020-06-10T09:26:17Z2018http://hdl.handle.net/1992/34912u820795.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Visual Analytics provide the user with tools to process data in a very intuitive way. One of the challenges Visual Analytics faces nowadays is the need to represent big amounts of information in a way that the user can explore. This large amount of data can not be managed by conventional machines and must be partitioned or underrepresented. Usually, visual analytics applications or widgets work with one single machine due to the requirements of low latency and quick interactions. This article presents Tadava, a visual analytics architecture based on representative sampling for large table-based datasets. Datasets samples are generated using systematics sampling and random sampling in order to obtain a collection of data from the original dataset. Experiments are made to determine the best sampling method to be used in datasets of different sizes, varying the step expected between samples. Tadava is built as a backend architecture for Navio, an interactive visualization widget for summarizing, exploring and navigating large datasets, and provides the widget with the capacity to manage table-based datasets between 400MB and 4GB."La analítica visual le provee al usuario herramientas de procesamiento de datos de forma intuitiva. Actualmente, uno de los desafíos que enfrenta la Analítica Visual es la necesidad de representar un gran volumen de información de manera tal que el usuario pueda explorarla. Es gran cantidad de datos no puede ser manejada por máquinas convencionales y debe ser partida o subrepresentada. Normalmente, las aplicaciones de analítica visual trabajan con una única máquina debido a los requerimientos de baja latencia e interacción rápida. Este artículo presenta Tadava, una arquitectura para analítica visual basada en un muestreo representativo sobre un gran volumen de datos tabulares. Muestreos de un de conjunto de datos son generados utilizando técnicas estadísticas de muestreo sistemático y aleatorio para obtener un subconjunto de los datos originales. Se realizan experimentos para determinar la mejor estrategia de muestreo a utilizar sobre conjuntos de datos de diferentes tamaños, variando el paso esperado entre muestras. Tadava es construida como una arquietctura backend para Navio, un widget interactivo de visualización para explorar, navegar y resumir grandes conjuntos de datos. Tadava provee la capacidad de manejar datos tabulares entre 400 MB y 4 GB."--Tomado del Formato de Documento de Grado.Magíster en Ingeniería de InformaciónMaestría46 hojasapplication/pdfengUniandesMaestría en Ingeniería de InformaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y Computacióninstname:Universidad de los Andesreponame:Repositorio Institucional SénecaTadava : visual analytics architecture for large table-based datasetsTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesishttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TMAnalítica visual - Investigaciones - Estudio de casosVisualización de la información - InvestigacionesArquitectura de software - InvestigacionesSoftware de aplicación - Investigaciones - Estudio de casosIngenieríaPublication26b87ca4-c283-4bc1-a992-d67be00dbf65virtual::6393-126b87ca4-c283-4bc1-a992-d67be00dbf65virtual::6393-1THUMBNAILu820795.pdf.jpgu820795.pdf.jpgIM Thumbnailimage/jpeg4820https://repositorio.uniandes.edu.co/bitstreams/dbbb4103-7e93-4b39-a428-c0d9a9447b93/download455d427d730a73d0d2c5d93b3e2d5846MD55ORIGINALu820795.pdfapplication/pdf4039632https://repositorio.uniandes.edu.co/bitstreams/fad4c855-2de9-4647-bc13-fcbdad13693b/download118dd30f015006d08fbdc2b796b46597MD51TEXTu820795.pdf.txtu820795.pdf.txtExtracted texttext/plain62216https://repositorio.uniandes.edu.co/bitstreams/16a301b8-59a1-44fa-a4f0-808cddbfe179/download3f336998f244d8023276a08d802883f5MD541992/34912oai:repositorio.uniandes.edu.co:1992/349122024-03-13 13:10:23.006http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co