Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020

Se propone un modelo de minería de texto aplicado a los trabajos de grado de la facultad de comunicación y lenguaje, específicamente a las tesis de comunicación social almacenadas en el repositorio institucional de la Pontificia Universidad Javeriana en el periodo 2010-2020. Se realiza un proceso de...

Full description

Autores:
Acevedo Rey, Santiago
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2021
Institución:
Pontificia Universidad Javeriana
Repositorio:
Repositorio Universidad Javeriana
Idioma:
spa
OAI Identifier:
oai:repository.javeriana.edu.co:10554/58515
Acceso en línea:
http://hdl.handle.net/10554/58515
Palabra clave:
Minería de texto
Procesamiento de lenguaje natural
Repositorios institucionales
Web scraping
Text mining
Natural language processing
Institutional repositories
Web scraping
Ciencia de la información, Bibliotecología y Archivística - Tesis y disertaciones académicas
Minería de datos
Repositorios institucionales
Procesamiento de palabras
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional
id JAVERIANA2_3ca43533666af51b9cd1e3af15d3e5a1
oai_identifier_str oai:repository.javeriana.edu.co:10554/58515
network_acronym_str JAVERIANA2
network_name_str Repositorio Universidad Javeriana
repository_id_str
dc.title.spa.fl_str_mv Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020
dc.title.english.spa.fl_str_mv Text mining model applied to the Institutional Repository of the Pontificia Universidad Javeriana : analysis of trends and categories in Social Communication theses from 2010-2020
title Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020
spellingShingle Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020
Minería de texto
Procesamiento de lenguaje natural
Repositorios institucionales
Web scraping
Text mining
Natural language processing
Institutional repositories
Web scraping
Ciencia de la información, Bibliotecología y Archivística - Tesis y disertaciones académicas
Minería de datos
Repositorios institucionales
Procesamiento de palabras
title_short Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020
title_full Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020
title_fullStr Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020
title_full_unstemmed Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020
title_sort Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020
dc.creator.fl_str_mv Acevedo Rey, Santiago
dc.contributor.advisor.none.fl_str_mv Pajaro Hernández, Juan Pablo
dc.contributor.author.none.fl_str_mv Acevedo Rey, Santiago
dc.subject.spa.fl_str_mv Minería de texto
Procesamiento de lenguaje natural
Repositorios institucionales
Web scraping
topic Minería de texto
Procesamiento de lenguaje natural
Repositorios institucionales
Web scraping
Text mining
Natural language processing
Institutional repositories
Web scraping
Ciencia de la información, Bibliotecología y Archivística - Tesis y disertaciones académicas
Minería de datos
Repositorios institucionales
Procesamiento de palabras
dc.subject.keyword.spa.fl_str_mv Text mining
Natural language processing
Institutional repositories
Web scraping
dc.subject.armarc.spa.fl_str_mv Ciencia de la información, Bibliotecología y Archivística - Tesis y disertaciones académicas
Minería de datos
Repositorios institucionales
Procesamiento de palabras
description Se propone un modelo de minería de texto aplicado a los trabajos de grado de la facultad de comunicación y lenguaje, específicamente a las tesis de comunicación social almacenadas en el repositorio institucional de la Pontificia Universidad Javeriana en el periodo 2010-2020. Se realiza un proceso de extracción de metadatos mediante un web scraper desarrollado en Python y se analiza el contenido de los datos obtenidos mediante herramientas y técnicas de procesamiento de lenguaje natural. Se realiza un análisis de los datos obtenidos y se proponen diferentes herramientas de visualización de datos para maximizar la visibilidad de las tendencias y categorías de la producción académica.
publishDate 2021
dc.date.created.none.fl_str_mv 2021-11-30
dc.date.accessioned.none.fl_str_mv 2022-01-20T13:42:02Z
dc.date.available.none.fl_str_mv 2022-01-20T13:42:02Z
dc.type.local.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10554/58515
dc.identifier.instname.spa.fl_str_mv instname:Pontificia Universidad Javeriana
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional - Pontificia Universidad Javeriana
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.javeriana.edu.co
url http://hdl.handle.net/10554/58515
identifier_str_mv instname:Pontificia Universidad Javeriana
reponame:Repositorio Institucional - Pontificia Universidad Javeriana
repourl:https://repository.javeriana.edu.co
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.licence.*.fl_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.spa.fl_str_mv PDF
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.temporal.none.fl_str_mv 2010-2020
dc.publisher.spa.fl_str_mv Pontificia Universidad Javeriana
dc.publisher.program.spa.fl_str_mv Ciencia de la Información, Bibliotecología y Archivística
dc.publisher.faculty.spa.fl_str_mv Facultad de Comunicación y Lenguaje
institution Pontificia Universidad Javeriana
bitstream.url.fl_str_mv http://repository.javeriana.edu.co/bitstream/10554/58515/1/Trabajo%20de%20grado.pdf
http://repository.javeriana.edu.co/bitstream/10554/58515/2/Carta_autorizacion.pdf
http://repository.javeriana.edu.co/bitstream/10554/58515/3/license.txt
http://repository.javeriana.edu.co/bitstream/10554/58515/4/Trabajo%20de%20grado.pdf.jpg
http://repository.javeriana.edu.co/bitstream/10554/58515/5/Carta_autorizacion.pdf.jpg
bitstream.checksum.fl_str_mv b4edd720c955f765750a82fe5bdf71a8
940d00fbaedf33815287916ff1c354c6
2070d280cc89439d983d9eee1b17df53
d0d4471fc1ec44ae4313eb1d1d8fe9dc
09cfef6326b85541e6595005d8ba1f97
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional - Pontificia Universidad Javeriana
repository.mail.fl_str_mv repositorio@javeriana.edu.co
_version_ 1811671270677282816
spelling Atribución-NoComercial-SinDerivadas 4.0 Internacionalinfo:eu-repo/semantics/openAccessDe acuerdo con la naturaleza del uso concedido, la presente licencia parcial se otorga a título gratuito por el máximo tiempo legal colombiano, con el propósito de que en dicho lapso mi (nuestra) obra sea explotada en las condiciones aquí estipuladas y para los fines indicados, respetando siempre la titularidad de los derechos patrimoniales y morales correspondientes, de acuerdo con los usos honrados, de manera proporcional y justificada a la finalidad perseguida, sin ánimo de lucro ni de comercialización. De manera complementaria, garantizo (garantizamos) en mi (nuestra) calidad de estudiante (s) y por ende autor (es) exclusivo (s), que la Tesis o Trabajo de Grado en cuestión, es producto de mi (nuestra) plena autoría, de mi (nuestro) esfuerzo personal intelectual, como consecuencia de mi (nuestra) creación original particular y, por tanto, soy (somos) el (los) único (s) titular (es) de la misma. Además, aseguro (aseguramos) que no contiene citas, ni transcripciones de otras obras protegidas, por fuera de los límites autorizados por la ley, según los usos honrados, y en proporción a los fines previstos; ni tampoco contempla declaraciones difamatorias contra terceros; respetando el derecho a la imagen, intimidad, buen nombre y demás derechos constitucionales. Adicionalmente, manifiesto (manifestamos) que no se incluyeron expresiones contrarias al orden público ni a las buenas costumbres. En consecuencia, la responsabilidad directa en la elaboración, presentación, investigación y, en general, contenidos de la Tesis o Trabajo de Grado es de mí (nuestro) competencia exclusiva, eximiendo de toda responsabilidad a la Pontifica Universidad Javeriana por tales aspectos. Sin perjuicio de los usos y atribuciones otorgadas en virtud de este documento, continuaré (continuaremos) conservando los correspondientes derechos patrimoniales sin modificación o restricción alguna, puesto que, de acuerdo con la legislación colombiana aplicable, el presente es un acuerdo jurídico que en ningún caso conlleva la enajenación de los derechos patrimoniales derivados del régimen del Derecho de Autor. De conformidad con lo establecido en el artículo 30 de la Ley 23 de 1982 y el artículo 11 de la Decisión Andina 351 de 1993, "Los derechos morales sobre el trabajo son propiedad de los autores", los cuales son irrenunciables, imprescriptibles, inembargables e inalienables. En consecuencia, la Pontificia Universidad Javeriana está en la obligación de RESPETARLOS Y HACERLOS RESPETAR, para lo cual tomará las medidas correspondientes para garantizar su observancia.http://purl.org/coar/access_right/c_abf2Pajaro Hernández, Juan PabloAcevedo Rey, Santiago2010-20202022-01-20T13:42:02Z2022-01-20T13:42:02Z2021-11-30http://hdl.handle.net/10554/58515instname:Pontificia Universidad Javerianareponame:Repositorio Institucional - Pontificia Universidad Javerianarepourl:https://repository.javeriana.edu.coSe propone un modelo de minería de texto aplicado a los trabajos de grado de la facultad de comunicación y lenguaje, específicamente a las tesis de comunicación social almacenadas en el repositorio institucional de la Pontificia Universidad Javeriana en el periodo 2010-2020. Se realiza un proceso de extracción de metadatos mediante un web scraper desarrollado en Python y se analiza el contenido de los datos obtenidos mediante herramientas y técnicas de procesamiento de lenguaje natural. Se realiza un análisis de los datos obtenidos y se proponen diferentes herramientas de visualización de datos para maximizar la visibilidad de las tendencias y categorías de la producción académica.This document proposes a text mining model applied to the undergraduate works of the faculty of communication and language, specifically to the social communication theses stored in the institutional repository of the Pontificia Universidad Javeriana in the period 2010-2020. A metadata extraction process is performed by means of a web scraper developed in Python and the content of the data obtained is analyzed using Natural Language Processing tools and techniques. An analysis of the data obtained is performed and different data visualization tools are proposed in order to maximize the visibility of trends and categories of academic production.Profesional en Ciencia de la Información, Bibliotecología y ArchivísticaPregradoPDFapplication/pdfspaPontificia Universidad JaverianaCiencia de la Información, Bibliotecología y ArchivísticaFacultad de Comunicación y Lenguajehttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Minería de textoProcesamiento de lenguaje naturalRepositorios institucionalesWeb scrapingText miningNatural language processingInstitutional repositoriesWeb scrapingCiencia de la información, Bibliotecología y Archivística - Tesis y disertaciones académicasMinería de datosRepositorios institucionalesProcesamiento de palabrasModelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020Text mining model applied to the Institutional Repository of the Pontificia Universidad Javeriana : analysis of trends and categories in Social Communication theses from 2010-2020Tesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisORIGINALTrabajo de grado.pdfTrabajo de grado.pdfDocumentoapplication/pdf3033379http://repository.javeriana.edu.co/bitstream/10554/58515/1/Trabajo%20de%20grado.pdfb4edd720c955f765750a82fe5bdf71a8MD51open accessCarta_autorizacion.pdfCarta_autorizacion.pdfLicencia de usoapplication/pdf1327281http://repository.javeriana.edu.co/bitstream/10554/58515/2/Carta_autorizacion.pdf940d00fbaedf33815287916ff1c354c6MD52metadata only accessLICENSElicense.txtlicense.txttext/plain; charset=utf-82603http://repository.javeriana.edu.co/bitstream/10554/58515/3/license.txt2070d280cc89439d983d9eee1b17df53MD53open accessTHUMBNAILTrabajo de grado.pdf.jpgTrabajo de grado.pdf.jpgIM Thumbnailimage/jpeg4769http://repository.javeriana.edu.co/bitstream/10554/58515/4/Trabajo%20de%20grado.pdf.jpgd0d4471fc1ec44ae4313eb1d1d8fe9dcMD54open accessCarta_autorizacion.pdf.jpgCarta_autorizacion.pdf.jpgIM Thumbnailimage/jpeg8255http://repository.javeriana.edu.co/bitstream/10554/58515/5/Carta_autorizacion.pdf.jpg09cfef6326b85541e6595005d8ba1f97MD55open access10554/58515oai:repository.javeriana.edu.co:10554/585152022-05-03 14:44:20.403Repositorio Institucional - Pontificia Universidad Javerianarepositorio@javeriana.edu.coTElDRU5DSUEgWSBBVVRPUklaQUNJw5NOIERFIExPUyBBVVRPUkVTIFBBUkEgUFVCTElDQVIgWSBQRVJNSVRJUiBMQSBDT05TVUxUQSBZIFVTTy4KClBhcnRlIDEuIFTDqXJtaW5vcyBkZSBsYSBsaWNlbmNpYSBnZW5lcmFsIHBhcmEgcHVibGljYWNpw7NuIGRlIG9icmFzIGVuIGVsIHJlcG9zaXRvcmlvIGluc3RpdHVjaW9uYWwKQ29tbyB0aXR1bGFyIChlcykgZGVsIGRlcmVjaG8gZGUgYXV0b3IsIGNvbmZpZXJvIChlcmltb3MpIGEgbGEgUG9udGlmaWNpYSBVbml2ZXJzaWRhZCBKYXZlcmlhbmEgdW5hIGxpY2VuY2lhIG5vIGV4Y2x1c2l2YSwgbGltaXRhZGEgeSBncmF0dWl0YSBzb2JyZSBsYSBvYnJhIHF1ZSBzZSBpbnRlZ3JhcsOhIGVuIGVsIFJlcG9zaXRvcmlvIEluc3RpdHVjaW9uYWwsIHF1ZSBzZSBhanVzdGEgYSBsYXMgc2lndWllbnRlcyBjYXJhY3RlcsOtc3RpY2FzOgphKSAgICAgIEVzdGFyw6EgdmlnZW50ZSBhIHBhcnRpciBkZSBsYSBmZWNoYSBkZSBpbmNsdXNpw7NuIGVuIGVsIHJlcG9zaXRvcmlvLCBwb3IgdW4gcGxhem8gZGUgNSBhw7FvcywgcXVlIHNlcsOhbiBwcm9ycm9nYWJsZXMgaW5kZWZpbmlkYW1lbnRlIHBvciBlbCB0aWVtcG8gcXVlIGR1cmUgZWwgZGVyZWNobyBwYXRyaW1vbmlhbCBkZWwgYXV0b3IuIEVsIGF1dG9yIHBvZHLDoSBkYXIgcG9yIHRlcm1pbmFkYSBsYSBsaWNlbmNpYSBzb2xpY2l0w6FuZG9sbyBhIGxhIFVuaXZlcnNpZGFkIHBvciBlc2NyaXRvLgpiKSAgICAgIEF1dG9yaXphIGEgbGEgUG9udGlmaWNpYSBVbml2ZXJzaWRhZCBKYXZlcmlhbmEgYSBwdWJsaWNhciBsYSBvYnJhIGVuIGRpZ2l0YWwsIGNvbm9jaWVuZG8gcXVlLCBkYWRvIHF1ZSBzZSBwdWJsaWNhIGVuIEludGVybmV0LCBwb3IgZXN0ZSBoZWNobyBjaXJjdWxhIGNvbiB1biBhbGNhbmNlIG11bmRpYWwuCmMpICAgICAgTG9zIGF1dG9yZXMgYWNlcHRhbiBxdWUgbGEgYXV0b3JpemFjacOzbiBzZSBoYWNlIGEgdMOtdHVsbyBncmF0dWl0bywgcG9yIGxvIHRhbnRvIHJlbnVuY2lhbiBhIHJlY2liaXIgYmVuZWZpY2lvIGFsZ3VubyBwb3IgbGEgcHVibGljYWNpw7NuLCBkaXN0cmlidWNpw7NuLCBjb211bmljYWNpw7NuIHDDumJsaWNhIHkgY3VhbHF1aWVyIG90cm8gdXNvIHF1ZSBzZSBoYWdhIGVuIGxvcyB0w6lybWlub3MgZGUgbGEgcHJlc2VudGUgbGljZW5jaWEgeSBkZSBsYSBsaWNlbmNpYSBkZSB1c28gY29uIHF1ZSBzZSBwdWJsaWNhLgpkKSAgICAgIExvcyBhdXRvcmVzIG1hbmlmaWVzdGFuIHF1ZSBzZSB0cmF0YSBkZSB1bmEgb2JyYSBvcmlnaW5hbCBzb2JyZSBsYSBxdWUgdGllbmVuIGxvcyBkZXJlY2hvcyBxdWUgYXV0b3JpemFuIHkgcXVlIHNvbiBlbGxvcyBxdWllbmVzIGFzdW1lbiB0b3RhbCByZXNwb25zYWJpbGlkYWQgcG9yIGVsIGNvbnRlbmlkbyBkZSBzdSBvYnJhIGFudGUgbGEgUG9udGlmaWNpYSBVbml2ZXJzaWRhZCBKYXZlcmlhbmEgeSBhbnRlIHRlcmNlcm9zLiBFbiB0b2RvIGNhc28gbGEgUG9udGlmaWNpYSBVbml2ZXJzaWRhZCBKYXZlcmlhbmEgc2UgY29tcHJvbWV0ZSBhIGluZGljYXIgc2llbXByZSBsYSBhdXRvcsOtYSBpbmNsdXllbmRvIGVsIG5vbWJyZSBkZWwgYXV0b3IgeSBsYSBmZWNoYSBkZSBwdWJsaWNhY2nDs24uCmUpICAgICAgQXV0b3Jpem8gKGFtb3MpIGEgbGEgVW5pdmVyc2lkYWQgcGFyYSBpbmNsdWlyIGxhIG9icmEgZW4gbG9zIMOtbmRpY2VzIHkgYnVzY2Fkb3JlcyBxdWUgZXN0aW1lbiBuZWNlc2FyaW9zIHBhcmEgcHJvbW92ZXIgc3UgZGlmdXNpw7NuLgpmKSAgICAgIEFjZXB0byAoYW1vcykgcXVlIGxhIFBvbnRpZmljaWEgVW5pdmVyc2lkYWQgSmF2ZXJpYW5hIHB1ZWRhIGNvbnZlcnRpciBlbCBkb2N1bWVudG8gYSBjdWFscXVpZXIgbWVkaW8gbyBmb3JtYXRvIHBhcmEgcHJvcMOzc2l0b3MgZGUgcHJlc2VydmFjacOzbiBkaWdpdGFsLgpnKSAgICAgIEF1dG9yaXpvIChhbW9zKSBxdWUgbGEgb2JyYSBzZWEgcHVlc3RhIGEgZGlzcG9zaWNpw7NuIGRlbCBww7pibGljbyBlbiBsb3MgdMOpcm1pbm9zIGF1dG9yaXphZG9zIGVuIGxvcyBsaXRlcmFsZXMgYW50ZXJpb3JlcyBiYWpvIGxvcyBsw61taXRlcyBkZWZpbmlkb3MgcG9yIGxhIHVuaXZlcnNpZGFkIGVuIGxhcyDigJxDb25kaWNpb25lcyBkZSB1c28gZGUgZXN0cmljdG8gY3VtcGxpbWllbnRv4oCdIGRlIGxvcyByZWN1cnNvcyBwdWJsaWNhZG9zIGVuIFJlcG9zaXRvcmlvIEluc3RpdHVjaW9uYWwgUFVKICwgY3V5byB0ZXh0byBjb21wbGV0byBzZSBwdWVkZSBjb25zdWx0YXIgZW4gaHR0cDovL3JlcG9zaXRvcnkuamF2ZXJpYW5hLmVkdS5jby8KClNJIEVMIERPQ1VNRU5UTyBTRSBCQVNBIEVOIFVOIFRSQUJBSk8gUVVFIEhBIFNJRE8gUEFUUk9DSU5BRE8gTyBBUE9ZQURPIFBPUiBVTkEgQUdFTkNJQSBPIFVOQSBPUkdBTklaQUNJw5NOLCBDT04gRVhDRVBDScOTTiBERSBMQSBQT05USUZJQ0lBIFVOSVZFUlNJREFEIEpBVkVSSUFOQSwgRUwgKExPUykgQVVUT1IoRVMpIEdBUkFOVElaQShNT1MpIFFVRSBTRSBIQSBDVU1QTElETyBDT04gTE9TIERFUkVDSE9TIFkgT0JMSUdBQ0lPTkVTIFJFUVVFUklET1MgUE9SIEVMIFJFU1BFQ1RJVk8gQ09OVFJBVE8gTyBBQ1VFUkRPLgo=