Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones
Minuto a minuto ideas, pensamientos, opiniones, libros, documentos, mensajes entre otros, son plasmados en el mundo a través de diferentes plataformas digitales disponibles para el uso de la humanidad. Este crecimiento exponencial de textos digitales ha traído diferentes desafíos de cara al análisis...
- Autores:
-
Rincón Ruiz, John Harley
- Tipo de recurso:
- Fecha de publicación:
- 2021
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/53331
- Acceso en línea:
- http://hdl.handle.net/1992/53331
- Palabra clave:
- Redes neurales (Computadores)
Recuperación de información
Sistemas de almacenamiento y recuperación de información
Ingeniería
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/4.0/
id |
UNIANDES2_a9169bfd369ee9a8730f1a17d1360cc2 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/53331 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones |
title |
Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones |
spellingShingle |
Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones Redes neurales (Computadores) Recuperación de información Sistemas de almacenamiento y recuperación de información Ingeniería |
title_short |
Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones |
title_full |
Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones |
title_fullStr |
Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones |
title_full_unstemmed |
Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones |
title_sort |
Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones |
dc.creator.fl_str_mv |
Rincón Ruiz, John Harley |
dc.contributor.advisor.none.fl_str_mv |
Núñez Castro, Haydemar María |
dc.contributor.author.none.fl_str_mv |
Rincón Ruiz, John Harley |
dc.contributor.jury.none.fl_str_mv |
Jiménez Guarín, Claudia Lucía Afanador Llach, María José |
dc.subject.armarc.none.fl_str_mv |
Redes neurales (Computadores) Recuperación de información Sistemas de almacenamiento y recuperación de información |
topic |
Redes neurales (Computadores) Recuperación de información Sistemas de almacenamiento y recuperación de información Ingeniería |
dc.subject.themes.none.fl_str_mv |
Ingeniería |
description |
Minuto a minuto ideas, pensamientos, opiniones, libros, documentos, mensajes entre otros, son plasmados en el mundo a través de diferentes plataformas digitales disponibles para el uso de la humanidad. Este crecimiento exponencial de textos digitales ha traído diferentes desafíos de cara al análisis, comprensión y entendimiento humano, por ejemplo, entender en un año de publicaciones de un periódico cuál fue el tema principal del que se habló en un país, conocer de los tweets disponibles cuál es el discurso real de un personaje político o extraer los detalles ocultos que se encuentran plasmados en los manuscritos de Leonardo Da Vinci. Realizar cualquiera de estas actividades de parte de un humano podría tomar un tiempo prolongado e indeterminado. Por fortuna, en los últimos años, dentro del campo del aprendizaje automático han surgido diversas técnicas que apoyan esta problemática y delegan este análisis de texto a las máquinas, entre estas se encuentra el modelado de tópicos. Esta propuesta basa su funcionamiento en el marco estadístico buscando apoyar el procesamiento y exploración de grandes volúmenes de textos digitales encontrando en ellos patrones ocultos que a simple vista no son fáciles de encontrar por un humano; es decir, es capaz de procesar colecciones de documentos digitales mostrando el espacio latente de los textos y revelando el significado profundo de la colección, del que se habla realmente. |
publishDate |
2021 |
dc.date.accessioned.none.fl_str_mv |
2021-11-03T16:18:40Z |
dc.date.available.none.fl_str_mv |
2021-11-03T16:18:40Z |
dc.date.issued.none.fl_str_mv |
2021 |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/53331 |
dc.identifier.pdf.none.fl_str_mv |
24279.pdf |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/53331 |
identifier_str_mv |
24279.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.none.fl_str_mv |
84 páginas |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.none.fl_str_mv |
Maestría en Ingeniería de Información |
dc.publisher.faculty.none.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.none.fl_str_mv |
Departamento de Ingeniería de Sistemas y Computación |
publisher.none.fl_str_mv |
Universidad de los Andes |
institution |
Universidad de los Andes |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/ffd8b875-3359-49ad-8c04-aa38a54b4abe/download https://repositorio.uniandes.edu.co/bitstreams/ba5e86c6-4eaa-481e-ae55-28ef6a493775/download https://repositorio.uniandes.edu.co/bitstreams/f7f3bf27-ccce-4862-979e-1abab40d6a8c/download |
bitstream.checksum.fl_str_mv |
6b51b1d303a5c7902627ba319f0c5c4d 54e43a1ad12794380fcb77836bdd9b17 3e36e9b1670122bfc844da702684fe88 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812134029765378048 |
spelling |
Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Núñez Castro, Haydemar Maríad6c667b2-5403-4255-b536-ba25a1f592ad600Rincón Ruiz, John Harleyf43b9555-b6b2-4fac-abcd-f6af28a3de6c600Jiménez Guarín, Claudia LucíaAfanador Llach, María José2021-11-03T16:18:40Z2021-11-03T16:18:40Z2021http://hdl.handle.net/1992/5333124279.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Minuto a minuto ideas, pensamientos, opiniones, libros, documentos, mensajes entre otros, son plasmados en el mundo a través de diferentes plataformas digitales disponibles para el uso de la humanidad. Este crecimiento exponencial de textos digitales ha traído diferentes desafíos de cara al análisis, comprensión y entendimiento humano, por ejemplo, entender en un año de publicaciones de un periódico cuál fue el tema principal del que se habló en un país, conocer de los tweets disponibles cuál es el discurso real de un personaje político o extraer los detalles ocultos que se encuentran plasmados en los manuscritos de Leonardo Da Vinci. Realizar cualquiera de estas actividades de parte de un humano podría tomar un tiempo prolongado e indeterminado. Por fortuna, en los últimos años, dentro del campo del aprendizaje automático han surgido diversas técnicas que apoyan esta problemática y delegan este análisis de texto a las máquinas, entre estas se encuentra el modelado de tópicos. Esta propuesta basa su funcionamiento en el marco estadístico buscando apoyar el procesamiento y exploración de grandes volúmenes de textos digitales encontrando en ellos patrones ocultos que a simple vista no son fáciles de encontrar por un humano; es decir, es capaz de procesar colecciones de documentos digitales mostrando el espacio latente de los textos y revelando el significado profundo de la colección, del que se habla realmente.Minute by minute ideas, thoughts, opinions, books, documents, messages, among others, are captured around the world through different digital platforms available for the use of humanity. This exponential growth of digital texts has brought different challenges in terms of analysis, comprehension and human understanding, for example, understand what was the main topic that was discussed in a country in one year of newspaper publications, know from the available tweets what is the real speech of a political figure or extract the hidden details that are embedded in the manuscripts of Leonardo Da Vinci. Performing any of these activities by a human could take a long and indeterminate amount of time. Fortunately, in recent years, in the machine learning area, several techniques have emerged to tackle this problem e.g., topic modeling, technique that delegate text analysis to machines. Topic modelling bases its operation on the statistical framework to support the processing and exploration of large volumes of digital documents to find hidden patterns in them that at first glance are not easy to see by a human; this technique is able to process collections of digital documents showing the latent space of the texts and revealing the deep meaning of the collection, what being talked about around documents. Today, topic modeling relies on several traditional techniques such as latent semantic analysis (LSA), probabilistic latent semantic analysis (pLSA) and latent Dirichlet attribution (LDA). In parallel, but not different way are the neural networks (NN) in constant growth and adoption due to advances in data processing and storage which have facilitated their training and deployment, neural networks are versatile when processing different types of e.g., digital text. This research presents a comparison of the traditional techniques of topic modeling versus neural networks taking as context the thoughts expressed by different authors in short and long digital documents.Magíster en Ingeniería de InformaciónMaestría84 páginasapplication/pdfspaUniversidad de los AndesMaestría en Ingeniería de InformaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y ComputaciónEstudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicacionesTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesishttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TMRedes neurales (Computadores)Recuperación de informaciónSistemas de almacenamiento y recuperación de informaciónIngeniería201707568PublicationTEXT24279.pdf.txt24279.pdf.txtExtracted texttext/plain191925https://repositorio.uniandes.edu.co/bitstreams/ffd8b875-3359-49ad-8c04-aa38a54b4abe/download6b51b1d303a5c7902627ba319f0c5c4dMD54THUMBNAIL24279.pdf.jpg24279.pdf.jpgIM Thumbnailimage/jpeg11296https://repositorio.uniandes.edu.co/bitstreams/ba5e86c6-4eaa-481e-ae55-28ef6a493775/download54e43a1ad12794380fcb77836bdd9b17MD55ORIGINAL24279.pdfapplication/pdf4316804https://repositorio.uniandes.edu.co/bitstreams/f7f3bf27-ccce-4862-979e-1abab40d6a8c/download3e36e9b1670122bfc844da702684fe88MD511992/53331oai:repositorio.uniandes.edu.co:1992/533312023-10-10 19:00:53.777http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co |