Human action video retrieval

Abstract The problem of efficiently answering a user information need in a video collection related to human actions is addressed in this thesis. The focus is given to the case where the user queries are stated using an example video containing the action of interest. Among the motivations of the wo...

Full description

Autores:
Páez Rivera, Fabián Mauricio
Tipo de recurso:
Fecha de publicación:
2015
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/55379
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/55379
http://bdigital.unal.edu.co/50782/
Palabra clave:
0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
62 Ingeniería y operaciones afines / Engineering
Latent semantics
Information retrieval
Multimodal indexing
Matrix factorization
Video analysis
Semántica latente
Recuperación de información
Indexación multimodal
Factorización de matrices
Análisis de video
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_34519b2ec68357d04bbbeaf0c76c87f4
oai_identifier_str oai:repositorio.unal.edu.co:unal/55379
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Human action video retrieval
title Human action video retrieval
spellingShingle Human action video retrieval
0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
62 Ingeniería y operaciones afines / Engineering
Latent semantics
Information retrieval
Multimodal indexing
Matrix factorization
Video analysis
Semántica latente
Recuperación de información
Indexación multimodal
Factorización de matrices
Análisis de video
title_short Human action video retrieval
title_full Human action video retrieval
title_fullStr Human action video retrieval
title_full_unstemmed Human action video retrieval
title_sort Human action video retrieval
dc.creator.fl_str_mv Páez Rivera, Fabián Mauricio
dc.contributor.author.spa.fl_str_mv Páez Rivera, Fabián Mauricio
dc.contributor.spa.fl_str_mv González Osorio, Fabio Augusto
dc.subject.ddc.spa.fl_str_mv 0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
62 Ingeniería y operaciones afines / Engineering
topic 0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
62 Ingeniería y operaciones afines / Engineering
Latent semantics
Information retrieval
Multimodal indexing
Matrix factorization
Video analysis
Semántica latente
Recuperación de información
Indexación multimodal
Factorización de matrices
Análisis de video
dc.subject.proposal.spa.fl_str_mv Latent semantics
Information retrieval
Multimodal indexing
Matrix factorization
Video analysis
Semántica latente
Recuperación de información
Indexación multimodal
Factorización de matrices
Análisis de video
description Abstract The problem of efficiently answering a user information need in a video collection related to human actions is addressed in this thesis. The focus is given to the case where the user queries are stated using an example video containing the action of interest. Among the motivations of the work is the growing complexity of available video content in terms of size and content diversity, and also the ubiquity of video content fueled by the widespread use of video cameras. To solve the problem at hand, an information retrieval system is proposed where multiple information modalities are leveraged if available to discover the latent semantics of the video collection. The central component are matrix factorization-based indexes which have been previously used on image retrieval settings. Along the way, different features and encoding methods for the visual information have been evaluated, such as Bag of Features, Fisher Vectors and Improved Trajectory Features. As a result, a system achieving similar performance as Support Vector Machines-based systems has been obtained.
publishDate 2015
dc.date.issued.spa.fl_str_mv 2015
dc.date.accessioned.spa.fl_str_mv 2019-07-02T11:18:30Z
dc.date.available.spa.fl_str_mv 2019-07-02T11:18:30Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/55379
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/50782/
url https://repositorio.unal.edu.co/handle/unal/55379
http://bdigital.unal.edu.co/50782/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial
Departamento de Ingeniería de Sistemas e Industrial
dc.relation.references.spa.fl_str_mv Páez Rivera, Fabián Mauricio (2015) Human action video retrieval. Maestría thesis, Universidad Nacional de Colombia- Bogotá.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/55379/1/1020718645.2015.pdf
https://repositorio.unal.edu.co/bitstream/unal/55379/2/1020718645.2015.pdf.jpg
bitstream.checksum.fl_str_mv ed2c0e25cd6f57d8e4f4b11121766e11
713d09b47877af6a4e93ec2380b073e8
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089724909846528
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2González Osorio, Fabio AugustoPáez Rivera, Fabián Mauricio142db90c-e95f-4071-8230-5e01015817d93002019-07-02T11:18:30Z2019-07-02T11:18:30Z2015https://repositorio.unal.edu.co/handle/unal/55379http://bdigital.unal.edu.co/50782/Abstract The problem of efficiently answering a user information need in a video collection related to human actions is addressed in this thesis. The focus is given to the case where the user queries are stated using an example video containing the action of interest. Among the motivations of the work is the growing complexity of available video content in terms of size and content diversity, and also the ubiquity of video content fueled by the widespread use of video cameras. To solve the problem at hand, an information retrieval system is proposed where multiple information modalities are leveraged if available to discover the latent semantics of the video collection. The central component are matrix factorization-based indexes which have been previously used on image retrieval settings. Along the way, different features and encoding methods for the visual information have been evaluated, such as Bag of Features, Fisher Vectors and Improved Trajectory Features. As a result, a system achieving similar performance as Support Vector Machines-based systems has been obtained.El problema de responder eficientemente a la necesidad de información de un usuario en una colección de vídeo relacionada con acciones humanas es abordado en esta tesis. El enfoque es dado al caso donde las consultas del usuario son planteadas usando un vídeo de ejemplo conteniendo la acción de interés. Entre las motivaciones del trabajo esta la creciente complejidad del contenido de vídeo disponible en términos de tamaño y diversidad de contenido, y también a la ubicuidad de contenido de vídeo potenciado por la amplia difusión de cámaras de vídeo. Para resolver el problema a la mano, se propone un sistema de recuperación de información en donde múltiples modalidades de información son aprovechadas si están disponibles, para descubrir la semántica latente de la colección de vídeos. El componente central son índices basados en factorización de matrices que han sido utilizados previamente en configuraciones de recuperación de imágenes. En el camino, diferentes características y métodos de codificación para la información visual han sido evaluados, tales como Bolsa de características, Vectores de Fisher y Características de Trayectorias Mejoradas. Como resultado, se ha obtenido un sistema que logra desempeño similar a sistemas basados en Maquinas de Vectores de Soporte.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e IndustrialDepartamento de Ingeniería de Sistemas e IndustrialPáez Rivera, Fabián Mauricio (2015) Human action video retrieval. Maestría thesis, Universidad Nacional de Colombia- Bogotá.0 Generalidades / Computer science, information and general works51 Matemáticas / Mathematics62 Ingeniería y operaciones afines / EngineeringLatent semanticsInformation retrievalMultimodal indexingMatrix factorizationVideo analysisSemántica latenteRecuperación de informaciónIndexación multimodalFactorización de matricesAnálisis de videoHuman action video retrievalTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL1020718645.2015.pdfapplication/pdf2380171https://repositorio.unal.edu.co/bitstream/unal/55379/1/1020718645.2015.pdfed2c0e25cd6f57d8e4f4b11121766e11MD51THUMBNAIL1020718645.2015.pdf.jpg1020718645.2015.pdf.jpgGenerated Thumbnailimage/jpeg3826https://repositorio.unal.edu.co/bitstream/unal/55379/2/1020718645.2015.pdf.jpg713d09b47877af6a4e93ec2380b073e8MD52unal/55379oai:repositorio.unal.edu.co:unal/553792024-03-17 23:07:57.196Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co