Human action video retrieval
Abstract The problem of efficiently answering a user information need in a video collection related to human actions is addressed in this thesis. The focus is given to the case where the user queries are stated using an example video containing the action of interest. Among the motivations of the wo...
- Autores:
-
Páez Rivera, Fabián Mauricio
- Tipo de recurso:
- Fecha de publicación:
- 2015
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/55379
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/55379
http://bdigital.unal.edu.co/50782/
- Palabra clave:
- 0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
62 Ingeniería y operaciones afines / Engineering
Latent semantics
Information retrieval
Multimodal indexing
Matrix factorization
Video analysis
Semántica latente
Recuperación de información
Indexación multimodal
Factorización de matrices
Análisis de video
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_34519b2ec68357d04bbbeaf0c76c87f4 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/55379 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Human action video retrieval |
title |
Human action video retrieval |
spellingShingle |
Human action video retrieval 0 Generalidades / Computer science, information and general works 51 Matemáticas / Mathematics 62 Ingeniería y operaciones afines / Engineering Latent semantics Information retrieval Multimodal indexing Matrix factorization Video analysis Semántica latente Recuperación de información Indexación multimodal Factorización de matrices Análisis de video |
title_short |
Human action video retrieval |
title_full |
Human action video retrieval |
title_fullStr |
Human action video retrieval |
title_full_unstemmed |
Human action video retrieval |
title_sort |
Human action video retrieval |
dc.creator.fl_str_mv |
Páez Rivera, Fabián Mauricio |
dc.contributor.author.spa.fl_str_mv |
Páez Rivera, Fabián Mauricio |
dc.contributor.spa.fl_str_mv |
González Osorio, Fabio Augusto |
dc.subject.ddc.spa.fl_str_mv |
0 Generalidades / Computer science, information and general works 51 Matemáticas / Mathematics 62 Ingeniería y operaciones afines / Engineering |
topic |
0 Generalidades / Computer science, information and general works 51 Matemáticas / Mathematics 62 Ingeniería y operaciones afines / Engineering Latent semantics Information retrieval Multimodal indexing Matrix factorization Video analysis Semántica latente Recuperación de información Indexación multimodal Factorización de matrices Análisis de video |
dc.subject.proposal.spa.fl_str_mv |
Latent semantics Information retrieval Multimodal indexing Matrix factorization Video analysis Semántica latente Recuperación de información Indexación multimodal Factorización de matrices Análisis de video |
description |
Abstract The problem of efficiently answering a user information need in a video collection related to human actions is addressed in this thesis. The focus is given to the case where the user queries are stated using an example video containing the action of interest. Among the motivations of the work is the growing complexity of available video content in terms of size and content diversity, and also the ubiquity of video content fueled by the widespread use of video cameras. To solve the problem at hand, an information retrieval system is proposed where multiple information modalities are leveraged if available to discover the latent semantics of the video collection. The central component are matrix factorization-based indexes which have been previously used on image retrieval settings. Along the way, different features and encoding methods for the visual information have been evaluated, such as Bag of Features, Fisher Vectors and Improved Trajectory Features. As a result, a system achieving similar performance as Support Vector Machines-based systems has been obtained. |
publishDate |
2015 |
dc.date.issued.spa.fl_str_mv |
2015 |
dc.date.accessioned.spa.fl_str_mv |
2019-07-02T11:18:30Z |
dc.date.available.spa.fl_str_mv |
2019-07-02T11:18:30Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/55379 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/50782/ |
url |
https://repositorio.unal.edu.co/handle/unal/55379 http://bdigital.unal.edu.co/50782/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial Departamento de Ingeniería de Sistemas e Industrial |
dc.relation.references.spa.fl_str_mv |
Páez Rivera, Fabián Mauricio (2015) Human action video retrieval. Maestría thesis, Universidad Nacional de Colombia- Bogotá. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/55379/1/1020718645.2015.pdf https://repositorio.unal.edu.co/bitstream/unal/55379/2/1020718645.2015.pdf.jpg |
bitstream.checksum.fl_str_mv |
ed2c0e25cd6f57d8e4f4b11121766e11 713d09b47877af6a4e93ec2380b073e8 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089724909846528 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2González Osorio, Fabio AugustoPáez Rivera, Fabián Mauricio142db90c-e95f-4071-8230-5e01015817d93002019-07-02T11:18:30Z2019-07-02T11:18:30Z2015https://repositorio.unal.edu.co/handle/unal/55379http://bdigital.unal.edu.co/50782/Abstract The problem of efficiently answering a user information need in a video collection related to human actions is addressed in this thesis. The focus is given to the case where the user queries are stated using an example video containing the action of interest. Among the motivations of the work is the growing complexity of available video content in terms of size and content diversity, and also the ubiquity of video content fueled by the widespread use of video cameras. To solve the problem at hand, an information retrieval system is proposed where multiple information modalities are leveraged if available to discover the latent semantics of the video collection. The central component are matrix factorization-based indexes which have been previously used on image retrieval settings. Along the way, different features and encoding methods for the visual information have been evaluated, such as Bag of Features, Fisher Vectors and Improved Trajectory Features. As a result, a system achieving similar performance as Support Vector Machines-based systems has been obtained.El problema de responder eficientemente a la necesidad de información de un usuario en una colección de vídeo relacionada con acciones humanas es abordado en esta tesis. El enfoque es dado al caso donde las consultas del usuario son planteadas usando un vídeo de ejemplo conteniendo la acción de interés. Entre las motivaciones del trabajo esta la creciente complejidad del contenido de vídeo disponible en términos de tamaño y diversidad de contenido, y también a la ubicuidad de contenido de vídeo potenciado por la amplia difusión de cámaras de vídeo. Para resolver el problema a la mano, se propone un sistema de recuperación de información en donde múltiples modalidades de información son aprovechadas si están disponibles, para descubrir la semántica latente de la colección de vídeos. El componente central son índices basados en factorización de matrices que han sido utilizados previamente en configuraciones de recuperación de imágenes. En el camino, diferentes características y métodos de codificación para la información visual han sido evaluados, tales como Bolsa de características, Vectores de Fisher y Características de Trayectorias Mejoradas. Como resultado, se ha obtenido un sistema que logra desempeño similar a sistemas basados en Maquinas de Vectores de Soporte.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e IndustrialDepartamento de Ingeniería de Sistemas e IndustrialPáez Rivera, Fabián Mauricio (2015) Human action video retrieval. Maestría thesis, Universidad Nacional de Colombia- Bogotá.0 Generalidades / Computer science, information and general works51 Matemáticas / Mathematics62 Ingeniería y operaciones afines / EngineeringLatent semanticsInformation retrievalMultimodal indexingMatrix factorizationVideo analysisSemántica latenteRecuperación de informaciónIndexación multimodalFactorización de matricesAnálisis de videoHuman action video retrievalTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL1020718645.2015.pdfapplication/pdf2380171https://repositorio.unal.edu.co/bitstream/unal/55379/1/1020718645.2015.pdfed2c0e25cd6f57d8e4f4b11121766e11MD51THUMBNAIL1020718645.2015.pdf.jpg1020718645.2015.pdf.jpgGenerated Thumbnailimage/jpeg3826https://repositorio.unal.edu.co/bitstream/unal/55379/2/1020718645.2015.pdf.jpg713d09b47877af6a4e93ec2380b073e8MD52unal/55379oai:repositorio.unal.edu.co:unal/553792024-03-17 23:07:57.196Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |