Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020
Se propone un modelo de minería de texto aplicado a los trabajos de grado de la facultad de comunicación y lenguaje, específicamente a las tesis de comunicación social almacenadas en el repositorio institucional de la Pontificia Universidad Javeriana en el periodo 2010-2020. Se realiza un proceso de...
- Autores:
-
Acevedo Rey, Santiago
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2021
- Institución:
- Pontificia Universidad Javeriana
- Repositorio:
- Repositorio Universidad Javeriana
- Idioma:
- spa
- OAI Identifier:
- oai:repository.javeriana.edu.co:10554/58515
- Acceso en línea:
- http://hdl.handle.net/10554/58515
- Palabra clave:
- Minería de texto
Procesamiento de lenguaje natural
Repositorios institucionales
Web scraping
Text mining
Natural language processing
Institutional repositories
Web scraping
Ciencia de la información, Bibliotecología y Archivística - Tesis y disertaciones académicas
Minería de datos
Repositorios institucionales
Procesamiento de palabras
- Rights
- openAccess
- License
- Atribución-NoComercial-SinDerivadas 4.0 Internacional
id |
JAVERIANA2_3ca43533666af51b9cd1e3af15d3e5a1 |
---|---|
oai_identifier_str |
oai:repository.javeriana.edu.co:10554/58515 |
network_acronym_str |
JAVERIANA2 |
network_name_str |
Repositorio Universidad Javeriana |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020 |
dc.title.english.spa.fl_str_mv |
Text mining model applied to the Institutional Repository of the Pontificia Universidad Javeriana : analysis of trends and categories in Social Communication theses from 2010-2020 |
title |
Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020 |
spellingShingle |
Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020 Minería de texto Procesamiento de lenguaje natural Repositorios institucionales Web scraping Text mining Natural language processing Institutional repositories Web scraping Ciencia de la información, Bibliotecología y Archivística - Tesis y disertaciones académicas Minería de datos Repositorios institucionales Procesamiento de palabras |
title_short |
Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020 |
title_full |
Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020 |
title_fullStr |
Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020 |
title_full_unstemmed |
Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020 |
title_sort |
Modelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020 |
dc.creator.fl_str_mv |
Acevedo Rey, Santiago |
dc.contributor.advisor.none.fl_str_mv |
Pajaro Hernández, Juan Pablo |
dc.contributor.author.none.fl_str_mv |
Acevedo Rey, Santiago |
dc.subject.spa.fl_str_mv |
Minería de texto Procesamiento de lenguaje natural Repositorios institucionales Web scraping |
topic |
Minería de texto Procesamiento de lenguaje natural Repositorios institucionales Web scraping Text mining Natural language processing Institutional repositories Web scraping Ciencia de la información, Bibliotecología y Archivística - Tesis y disertaciones académicas Minería de datos Repositorios institucionales Procesamiento de palabras |
dc.subject.keyword.spa.fl_str_mv |
Text mining Natural language processing Institutional repositories Web scraping |
dc.subject.armarc.spa.fl_str_mv |
Ciencia de la información, Bibliotecología y Archivística - Tesis y disertaciones académicas Minería de datos Repositorios institucionales Procesamiento de palabras |
description |
Se propone un modelo de minería de texto aplicado a los trabajos de grado de la facultad de comunicación y lenguaje, específicamente a las tesis de comunicación social almacenadas en el repositorio institucional de la Pontificia Universidad Javeriana en el periodo 2010-2020. Se realiza un proceso de extracción de metadatos mediante un web scraper desarrollado en Python y se analiza el contenido de los datos obtenidos mediante herramientas y técnicas de procesamiento de lenguaje natural. Se realiza un análisis de los datos obtenidos y se proponen diferentes herramientas de visualización de datos para maximizar la visibilidad de las tendencias y categorías de la producción académica. |
publishDate |
2021 |
dc.date.created.none.fl_str_mv |
2021-11-30 |
dc.date.accessioned.none.fl_str_mv |
2022-01-20T13:42:02Z |
dc.date.available.none.fl_str_mv |
2022-01-20T13:42:02Z |
dc.type.local.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Pregrado |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10554/58515 |
dc.identifier.instname.spa.fl_str_mv |
instname:Pontificia Universidad Javeriana |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional - Pontificia Universidad Javeriana |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repository.javeriana.edu.co |
url |
http://hdl.handle.net/10554/58515 |
identifier_str_mv |
instname:Pontificia Universidad Javeriana reponame:Repositorio Institucional - Pontificia Universidad Javeriana repourl:https://repository.javeriana.edu.co |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.licence.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 4.0 Internacional |
dc.rights.accessrights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Atribución-NoComercial-SinDerivadas 4.0 Internacional http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.spa.fl_str_mv |
PDF |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.coverage.temporal.none.fl_str_mv |
2010-2020 |
dc.publisher.spa.fl_str_mv |
Pontificia Universidad Javeriana |
dc.publisher.program.spa.fl_str_mv |
Ciencia de la Información, Bibliotecología y Archivística |
dc.publisher.faculty.spa.fl_str_mv |
Facultad de Comunicación y Lenguaje |
institution |
Pontificia Universidad Javeriana |
bitstream.url.fl_str_mv |
http://repository.javeriana.edu.co/bitstream/10554/58515/1/Trabajo%20de%20grado.pdf http://repository.javeriana.edu.co/bitstream/10554/58515/2/Carta_autorizacion.pdf http://repository.javeriana.edu.co/bitstream/10554/58515/3/license.txt http://repository.javeriana.edu.co/bitstream/10554/58515/4/Trabajo%20de%20grado.pdf.jpg http://repository.javeriana.edu.co/bitstream/10554/58515/5/Carta_autorizacion.pdf.jpg |
bitstream.checksum.fl_str_mv |
b4edd720c955f765750a82fe5bdf71a8 940d00fbaedf33815287916ff1c354c6 2070d280cc89439d983d9eee1b17df53 d0d4471fc1ec44ae4313eb1d1d8fe9dc 09cfef6326b85541e6595005d8ba1f97 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional - Pontificia Universidad Javeriana |
repository.mail.fl_str_mv |
repositorio@javeriana.edu.co |
_version_ |
1811671270677282816 |
spelling |
Atribución-NoComercial-SinDerivadas 4.0 Internacionalinfo:eu-repo/semantics/openAccessDe acuerdo con la naturaleza del uso concedido, la presente licencia parcial se otorga a título gratuito por el máximo tiempo legal colombiano, con el propósito de que en dicho lapso mi (nuestra) obra sea explotada en las condiciones aquí estipuladas y para los fines indicados, respetando siempre la titularidad de los derechos patrimoniales y morales correspondientes, de acuerdo con los usos honrados, de manera proporcional y justificada a la finalidad perseguida, sin ánimo de lucro ni de comercialización. De manera complementaria, garantizo (garantizamos) en mi (nuestra) calidad de estudiante (s) y por ende autor (es) exclusivo (s), que la Tesis o Trabajo de Grado en cuestión, es producto de mi (nuestra) plena autoría, de mi (nuestro) esfuerzo personal intelectual, como consecuencia de mi (nuestra) creación original particular y, por tanto, soy (somos) el (los) único (s) titular (es) de la misma. Además, aseguro (aseguramos) que no contiene citas, ni transcripciones de otras obras protegidas, por fuera de los límites autorizados por la ley, según los usos honrados, y en proporción a los fines previstos; ni tampoco contempla declaraciones difamatorias contra terceros; respetando el derecho a la imagen, intimidad, buen nombre y demás derechos constitucionales. Adicionalmente, manifiesto (manifestamos) que no se incluyeron expresiones contrarias al orden público ni a las buenas costumbres. En consecuencia, la responsabilidad directa en la elaboración, presentación, investigación y, en general, contenidos de la Tesis o Trabajo de Grado es de mí (nuestro) competencia exclusiva, eximiendo de toda responsabilidad a la Pontifica Universidad Javeriana por tales aspectos. Sin perjuicio de los usos y atribuciones otorgadas en virtud de este documento, continuaré (continuaremos) conservando los correspondientes derechos patrimoniales sin modificación o restricción alguna, puesto que, de acuerdo con la legislación colombiana aplicable, el presente es un acuerdo jurídico que en ningún caso conlleva la enajenación de los derechos patrimoniales derivados del régimen del Derecho de Autor. De conformidad con lo establecido en el artículo 30 de la Ley 23 de 1982 y el artículo 11 de la Decisión Andina 351 de 1993, "Los derechos morales sobre el trabajo son propiedad de los autores", los cuales son irrenunciables, imprescriptibles, inembargables e inalienables. En consecuencia, la Pontificia Universidad Javeriana está en la obligación de RESPETARLOS Y HACERLOS RESPETAR, para lo cual tomará las medidas correspondientes para garantizar su observancia.http://purl.org/coar/access_right/c_abf2Pajaro Hernández, Juan PabloAcevedo Rey, Santiago2010-20202022-01-20T13:42:02Z2022-01-20T13:42:02Z2021-11-30http://hdl.handle.net/10554/58515instname:Pontificia Universidad Javerianareponame:Repositorio Institucional - Pontificia Universidad Javerianarepourl:https://repository.javeriana.edu.coSe propone un modelo de minería de texto aplicado a los trabajos de grado de la facultad de comunicación y lenguaje, específicamente a las tesis de comunicación social almacenadas en el repositorio institucional de la Pontificia Universidad Javeriana en el periodo 2010-2020. Se realiza un proceso de extracción de metadatos mediante un web scraper desarrollado en Python y se analiza el contenido de los datos obtenidos mediante herramientas y técnicas de procesamiento de lenguaje natural. Se realiza un análisis de los datos obtenidos y se proponen diferentes herramientas de visualización de datos para maximizar la visibilidad de las tendencias y categorías de la producción académica.This document proposes a text mining model applied to the undergraduate works of the faculty of communication and language, specifically to the social communication theses stored in the institutional repository of the Pontificia Universidad Javeriana in the period 2010-2020. A metadata extraction process is performed by means of a web scraper developed in Python and the content of the data obtained is analyzed using Natural Language Processing tools and techniques. An analysis of the data obtained is performed and different data visualization tools are proposed in order to maximize the visibility of trends and categories of academic production.Profesional en Ciencia de la Información, Bibliotecología y ArchivísticaPregradoPDFapplication/pdfspaPontificia Universidad JaverianaCiencia de la Información, Bibliotecología y ArchivísticaFacultad de Comunicación y Lenguajehttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Minería de textoProcesamiento de lenguaje naturalRepositorios institucionalesWeb scrapingText miningNatural language processingInstitutional repositoriesWeb scrapingCiencia de la información, Bibliotecología y Archivística - Tesis y disertaciones académicasMinería de datosRepositorios institucionalesProcesamiento de palabrasModelo de minería de texto aplicado al Repositorio Institucional de la Pontificia Universidad Javeriana : análisis de tendencias y categorías en las tesis de Comunicación Social de 2010-2020Text mining model applied to the Institutional Repository of the Pontificia Universidad Javeriana : analysis of trends and categories in Social Communication theses from 2010-2020Tesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisORIGINALTrabajo de grado.pdfTrabajo de grado.pdfDocumentoapplication/pdf3033379http://repository.javeriana.edu.co/bitstream/10554/58515/1/Trabajo%20de%20grado.pdfb4edd720c955f765750a82fe5bdf71a8MD51open accessCarta_autorizacion.pdfCarta_autorizacion.pdfLicencia de usoapplication/pdf1327281http://repository.javeriana.edu.co/bitstream/10554/58515/2/Carta_autorizacion.pdf940d00fbaedf33815287916ff1c354c6MD52metadata only accessLICENSElicense.txtlicense.txttext/plain; charset=utf-82603http://repository.javeriana.edu.co/bitstream/10554/58515/3/license.txt2070d280cc89439d983d9eee1b17df53MD53open accessTHUMBNAILTrabajo de grado.pdf.jpgTrabajo de grado.pdf.jpgIM Thumbnailimage/jpeg4769http://repository.javeriana.edu.co/bitstream/10554/58515/4/Trabajo%20de%20grado.pdf.jpgd0d4471fc1ec44ae4313eb1d1d8fe9dcMD54open accessCarta_autorizacion.pdf.jpgCarta_autorizacion.pdf.jpgIM Thumbnailimage/jpeg8255http://repository.javeriana.edu.co/bitstream/10554/58515/5/Carta_autorizacion.pdf.jpg09cfef6326b85541e6595005d8ba1f97MD55open access10554/58515oai:repository.javeriana.edu.co:10554/585152022-05-03 14:44:20.403Repositorio Institucional - Pontificia Universidad Javerianarepositorio@javeriana.edu.coTElDRU5DSUEgWSBBVVRPUklaQUNJw5NOIERFIExPUyBBVVRPUkVTIFBBUkEgUFVCTElDQVIgWSBQRVJNSVRJUiBMQSBDT05TVUxUQSBZIFVTTy4KClBhcnRlIDEuIFTDqXJtaW5vcyBkZSBsYSBsaWNlbmNpYSBnZW5lcmFsIHBhcmEgcHVibGljYWNpw7NuIGRlIG9icmFzIGVuIGVsIHJlcG9zaXRvcmlvIGluc3RpdHVjaW9uYWwKQ29tbyB0aXR1bGFyIChlcykgZGVsIGRlcmVjaG8gZGUgYXV0b3IsIGNvbmZpZXJvIChlcmltb3MpIGEgbGEgUG9udGlmaWNpYSBVbml2ZXJzaWRhZCBKYXZlcmlhbmEgdW5hIGxpY2VuY2lhIG5vIGV4Y2x1c2l2YSwgbGltaXRhZGEgeSBncmF0dWl0YSBzb2JyZSBsYSBvYnJhIHF1ZSBzZSBpbnRlZ3JhcsOhIGVuIGVsIFJlcG9zaXRvcmlvIEluc3RpdHVjaW9uYWwsIHF1ZSBzZSBhanVzdGEgYSBsYXMgc2lndWllbnRlcyBjYXJhY3RlcsOtc3RpY2FzOgphKSAgICAgIEVzdGFyw6EgdmlnZW50ZSBhIHBhcnRpciBkZSBsYSBmZWNoYSBkZSBpbmNsdXNpw7NuIGVuIGVsIHJlcG9zaXRvcmlvLCBwb3IgdW4gcGxhem8gZGUgNSBhw7FvcywgcXVlIHNlcsOhbiBwcm9ycm9nYWJsZXMgaW5kZWZpbmlkYW1lbnRlIHBvciBlbCB0aWVtcG8gcXVlIGR1cmUgZWwgZGVyZWNobyBwYXRyaW1vbmlhbCBkZWwgYXV0b3IuIEVsIGF1dG9yIHBvZHLDoSBkYXIgcG9yIHRlcm1pbmFkYSBsYSBsaWNlbmNpYSBzb2xpY2l0w6FuZG9sbyBhIGxhIFVuaXZlcnNpZGFkIHBvciBlc2NyaXRvLgpiKSAgICAgIEF1dG9yaXphIGEgbGEgUG9udGlmaWNpYSBVbml2ZXJzaWRhZCBKYXZlcmlhbmEgYSBwdWJsaWNhciBsYSBvYnJhIGVuIGRpZ2l0YWwsIGNvbm9jaWVuZG8gcXVlLCBkYWRvIHF1ZSBzZSBwdWJsaWNhIGVuIEludGVybmV0LCBwb3IgZXN0ZSBoZWNobyBjaXJjdWxhIGNvbiB1biBhbGNhbmNlIG11bmRpYWwuCmMpICAgICAgTG9zIGF1dG9yZXMgYWNlcHRhbiBxdWUgbGEgYXV0b3JpemFjacOzbiBzZSBoYWNlIGEgdMOtdHVsbyBncmF0dWl0bywgcG9yIGxvIHRhbnRvIHJlbnVuY2lhbiBhIHJlY2liaXIgYmVuZWZpY2lvIGFsZ3VubyBwb3IgbGEgcHVibGljYWNpw7NuLCBkaXN0cmlidWNpw7NuLCBjb211bmljYWNpw7NuIHDDumJsaWNhIHkgY3VhbHF1aWVyIG90cm8gdXNvIHF1ZSBzZSBoYWdhIGVuIGxvcyB0w6lybWlub3MgZGUgbGEgcHJlc2VudGUgbGljZW5jaWEgeSBkZSBsYSBsaWNlbmNpYSBkZSB1c28gY29uIHF1ZSBzZSBwdWJsaWNhLgpkKSAgICAgIExvcyBhdXRvcmVzIG1hbmlmaWVzdGFuIHF1ZSBzZSB0cmF0YSBkZSB1bmEgb2JyYSBvcmlnaW5hbCBzb2JyZSBsYSBxdWUgdGllbmVuIGxvcyBkZXJlY2hvcyBxdWUgYXV0b3JpemFuIHkgcXVlIHNvbiBlbGxvcyBxdWllbmVzIGFzdW1lbiB0b3RhbCByZXNwb25zYWJpbGlkYWQgcG9yIGVsIGNvbnRlbmlkbyBkZSBzdSBvYnJhIGFudGUgbGEgUG9udGlmaWNpYSBVbml2ZXJzaWRhZCBKYXZlcmlhbmEgeSBhbnRlIHRlcmNlcm9zLiBFbiB0b2RvIGNhc28gbGEgUG9udGlmaWNpYSBVbml2ZXJzaWRhZCBKYXZlcmlhbmEgc2UgY29tcHJvbWV0ZSBhIGluZGljYXIgc2llbXByZSBsYSBhdXRvcsOtYSBpbmNsdXllbmRvIGVsIG5vbWJyZSBkZWwgYXV0b3IgeSBsYSBmZWNoYSBkZSBwdWJsaWNhY2nDs24uCmUpICAgICAgQXV0b3Jpem8gKGFtb3MpIGEgbGEgVW5pdmVyc2lkYWQgcGFyYSBpbmNsdWlyIGxhIG9icmEgZW4gbG9zIMOtbmRpY2VzIHkgYnVzY2Fkb3JlcyBxdWUgZXN0aW1lbiBuZWNlc2FyaW9zIHBhcmEgcHJvbW92ZXIgc3UgZGlmdXNpw7NuLgpmKSAgICAgIEFjZXB0byAoYW1vcykgcXVlIGxhIFBvbnRpZmljaWEgVW5pdmVyc2lkYWQgSmF2ZXJpYW5hIHB1ZWRhIGNvbnZlcnRpciBlbCBkb2N1bWVudG8gYSBjdWFscXVpZXIgbWVkaW8gbyBmb3JtYXRvIHBhcmEgcHJvcMOzc2l0b3MgZGUgcHJlc2VydmFjacOzbiBkaWdpdGFsLgpnKSAgICAgIEF1dG9yaXpvIChhbW9zKSBxdWUgbGEgb2JyYSBzZWEgcHVlc3RhIGEgZGlzcG9zaWNpw7NuIGRlbCBww7pibGljbyBlbiBsb3MgdMOpcm1pbm9zIGF1dG9yaXphZG9zIGVuIGxvcyBsaXRlcmFsZXMgYW50ZXJpb3JlcyBiYWpvIGxvcyBsw61taXRlcyBkZWZpbmlkb3MgcG9yIGxhIHVuaXZlcnNpZGFkIGVuIGxhcyDigJxDb25kaWNpb25lcyBkZSB1c28gZGUgZXN0cmljdG8gY3VtcGxpbWllbnRv4oCdIGRlIGxvcyByZWN1cnNvcyBwdWJsaWNhZG9zIGVuIFJlcG9zaXRvcmlvIEluc3RpdHVjaW9uYWwgUFVKICwgY3V5byB0ZXh0byBjb21wbGV0byBzZSBwdWVkZSBjb25zdWx0YXIgZW4gaHR0cDovL3JlcG9zaXRvcnkuamF2ZXJpYW5hLmVkdS5jby8KClNJIEVMIERPQ1VNRU5UTyBTRSBCQVNBIEVOIFVOIFRSQUJBSk8gUVVFIEhBIFNJRE8gUEFUUk9DSU5BRE8gTyBBUE9ZQURPIFBPUiBVTkEgQUdFTkNJQSBPIFVOQSBPUkdBTklaQUNJw5NOLCBDT04gRVhDRVBDScOTTiBERSBMQSBQT05USUZJQ0lBIFVOSVZFUlNJREFEIEpBVkVSSUFOQSwgRUwgKExPUykgQVVUT1IoRVMpIEdBUkFOVElaQShNT1MpIFFVRSBTRSBIQSBDVU1QTElETyBDT04gTE9TIERFUkVDSE9TIFkgT0JMSUdBQ0lPTkVTIFJFUVVFUklET1MgUE9SIEVMIFJFU1BFQ1RJVk8gQ09OVFJBVE8gTyBBQ1VFUkRPLgo= |