Tadava : visual analytics architecture for large table-based datasets
Visual Analytics provide the user with tools to process data in a very intuitive way. One of the challenges Visual Analytics faces nowadays is the need to represent big amounts of information in a way that the user can explore. This large amount of data can not be managed by conventional machines an...
- Autores:
-
Ortiz Román, Juan Camilo
- Tipo de recurso:
- Fecha de publicación:
- 2018
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- eng
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/34912
- Acceso en línea:
- http://hdl.handle.net/1992/34912
- Palabra clave:
- Analítica visual - Investigaciones - Estudio de casos
Visualización de la información - Investigaciones
Arquitectura de software - Investigaciones
Software de aplicación - Investigaciones - Estudio de casos
Ingeniería
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/4.0/
id |
UNIANDES2_b8d9b8efef51b99d186cd91a519ea1b6 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/34912 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.es_CO.fl_str_mv |
Tadava : visual analytics architecture for large table-based datasets |
title |
Tadava : visual analytics architecture for large table-based datasets |
spellingShingle |
Tadava : visual analytics architecture for large table-based datasets Analítica visual - Investigaciones - Estudio de casos Visualización de la información - Investigaciones Arquitectura de software - Investigaciones Software de aplicación - Investigaciones - Estudio de casos Ingeniería |
title_short |
Tadava : visual analytics architecture for large table-based datasets |
title_full |
Tadava : visual analytics architecture for large table-based datasets |
title_fullStr |
Tadava : visual analytics architecture for large table-based datasets |
title_full_unstemmed |
Tadava : visual analytics architecture for large table-based datasets |
title_sort |
Tadava : visual analytics architecture for large table-based datasets |
dc.creator.fl_str_mv |
Ortiz Román, Juan Camilo |
dc.contributor.advisor.none.fl_str_mv |
Guerra Gómez, John Alexis |
dc.contributor.author.none.fl_str_mv |
Ortiz Román, Juan Camilo |
dc.contributor.jury.none.fl_str_mv |
Hernández Peñaloza, José Tiberio Botero, Juan Felipe |
dc.subject.keyword.es_CO.fl_str_mv |
Analítica visual - Investigaciones - Estudio de casos Visualización de la información - Investigaciones Arquitectura de software - Investigaciones Software de aplicación - Investigaciones - Estudio de casos |
topic |
Analítica visual - Investigaciones - Estudio de casos Visualización de la información - Investigaciones Arquitectura de software - Investigaciones Software de aplicación - Investigaciones - Estudio de casos Ingeniería |
dc.subject.themes.none.fl_str_mv |
Ingeniería |
description |
Visual Analytics provide the user with tools to process data in a very intuitive way. One of the challenges Visual Analytics faces nowadays is the need to represent big amounts of information in a way that the user can explore. This large amount of data can not be managed by conventional machines and must be partitioned or underrepresented. Usually, visual analytics applications or widgets work with one single machine due to the requirements of low latency and quick interactions. This article presents Tadava, a visual analytics architecture based on representative sampling for large table-based datasets. Datasets samples are generated using systematics sampling and random sampling in order to obtain a collection of data from the original dataset. Experiments are made to determine the best sampling method to be used in datasets of different sizes, varying the step expected between samples. Tadava is built as a backend architecture for Navio, an interactive visualization widget for summarizing, exploring and navigating large datasets, and provides the widget with the capacity to manage table-based datasets between 400MB and 4GB. |
publishDate |
2018 |
dc.date.issued.none.fl_str_mv |
2018 |
dc.date.accessioned.none.fl_str_mv |
2020-06-10T09:26:17Z |
dc.date.available.none.fl_str_mv |
2020-06-10T09:26:17Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/34912 |
dc.identifier.pdf.none.fl_str_mv |
u820795.pdf |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/34912 |
identifier_str_mv |
u820795.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.es_CO.fl_str_mv |
eng |
language |
eng |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.es_CO.fl_str_mv |
46 hojas |
dc.format.mimetype.es_CO.fl_str_mv |
application/pdf |
dc.publisher.es_CO.fl_str_mv |
Uniandes |
dc.publisher.program.es_CO.fl_str_mv |
Maestría en Ingeniería de Información |
dc.publisher.faculty.es_CO.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.es_CO.fl_str_mv |
Departamento de Ingeniería de Sistemas y Computación |
dc.source.es_CO.fl_str_mv |
instname:Universidad de los Andes reponame:Repositorio Institucional Séneca |
instname_str |
Universidad de los Andes |
institution |
Universidad de los Andes |
reponame_str |
Repositorio Institucional Séneca |
collection |
Repositorio Institucional Séneca |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/dbbb4103-7e93-4b39-a428-c0d9a9447b93/download https://repositorio.uniandes.edu.co/bitstreams/fad4c855-2de9-4647-bc13-fcbdad13693b/download https://repositorio.uniandes.edu.co/bitstreams/16a301b8-59a1-44fa-a4f0-808cddbfe179/download |
bitstream.checksum.fl_str_mv |
455d427d730a73d0d2c5d93b3e2d5846 118dd30f015006d08fbdc2b796b46597 3f336998f244d8023276a08d802883f5 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812133898309599232 |
spelling |
Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Guerra Gómez, John Alexisvirtual::6393-1Ortiz Román, Juan Camilodabba6bb-eb8b-4a2a-b278-b954c63b470c500Hernández Peñaloza, José TiberioBotero, Juan Felipe2020-06-10T09:26:17Z2020-06-10T09:26:17Z2018http://hdl.handle.net/1992/34912u820795.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Visual Analytics provide the user with tools to process data in a very intuitive way. One of the challenges Visual Analytics faces nowadays is the need to represent big amounts of information in a way that the user can explore. This large amount of data can not be managed by conventional machines and must be partitioned or underrepresented. Usually, visual analytics applications or widgets work with one single machine due to the requirements of low latency and quick interactions. This article presents Tadava, a visual analytics architecture based on representative sampling for large table-based datasets. Datasets samples are generated using systematics sampling and random sampling in order to obtain a collection of data from the original dataset. Experiments are made to determine the best sampling method to be used in datasets of different sizes, varying the step expected between samples. Tadava is built as a backend architecture for Navio, an interactive visualization widget for summarizing, exploring and navigating large datasets, and provides the widget with the capacity to manage table-based datasets between 400MB and 4GB."La analítica visual le provee al usuario herramientas de procesamiento de datos de forma intuitiva. Actualmente, uno de los desafíos que enfrenta la Analítica Visual es la necesidad de representar un gran volumen de información de manera tal que el usuario pueda explorarla. Es gran cantidad de datos no puede ser manejada por máquinas convencionales y debe ser partida o subrepresentada. Normalmente, las aplicaciones de analítica visual trabajan con una única máquina debido a los requerimientos de baja latencia e interacción rápida. Este artículo presenta Tadava, una arquitectura para analítica visual basada en un muestreo representativo sobre un gran volumen de datos tabulares. Muestreos de un de conjunto de datos son generados utilizando técnicas estadísticas de muestreo sistemático y aleatorio para obtener un subconjunto de los datos originales. Se realizan experimentos para determinar la mejor estrategia de muestreo a utilizar sobre conjuntos de datos de diferentes tamaños, variando el paso esperado entre muestras. Tadava es construida como una arquietctura backend para Navio, un widget interactivo de visualización para explorar, navegar y resumir grandes conjuntos de datos. Tadava provee la capacidad de manejar datos tabulares entre 400 MB y 4 GB."--Tomado del Formato de Documento de Grado.Magíster en Ingeniería de InformaciónMaestría46 hojasapplication/pdfengUniandesMaestría en Ingeniería de InformaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y Computacióninstname:Universidad de los Andesreponame:Repositorio Institucional SénecaTadava : visual analytics architecture for large table-based datasetsTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesishttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TMAnalítica visual - Investigaciones - Estudio de casosVisualización de la información - InvestigacionesArquitectura de software - InvestigacionesSoftware de aplicación - Investigaciones - Estudio de casosIngenieríaPublication26b87ca4-c283-4bc1-a992-d67be00dbf65virtual::6393-126b87ca4-c283-4bc1-a992-d67be00dbf65virtual::6393-1THUMBNAILu820795.pdf.jpgu820795.pdf.jpgIM Thumbnailimage/jpeg4820https://repositorio.uniandes.edu.co/bitstreams/dbbb4103-7e93-4b39-a428-c0d9a9447b93/download455d427d730a73d0d2c5d93b3e2d5846MD55ORIGINALu820795.pdfapplication/pdf4039632https://repositorio.uniandes.edu.co/bitstreams/fad4c855-2de9-4647-bc13-fcbdad13693b/download118dd30f015006d08fbdc2b796b46597MD51TEXTu820795.pdf.txtu820795.pdf.txtExtracted texttext/plain62216https://repositorio.uniandes.edu.co/bitstreams/16a301b8-59a1-44fa-a4f0-808cddbfe179/download3f336998f244d8023276a08d802883f5MD541992/34912oai:repositorio.uniandes.edu.co:1992/349122024-03-13 13:10:23.006http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co |