Desarrollo de una Herramienta computacional que Permita Realizar Extracción terminológica sobre Literatura Científica en IOT

Proyecto de aplicación de conocimiento (Ingeniería en Sistemas y Telecomunicaciones), Facultad de Ciencias Básicas e Ingeniería, Pereira, 2023

Autores:
Morales Ríos, Alejandro
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Universidad Católica de Pereira
Repositorio:
Repositorio Institucional - RIBUC
Idioma:
spa
OAI Identifier:
oai:repositorio.ucp.edu.co:10785/15651
Acceso en línea:
https://repositorio.ucp.edu.co/entities/publication/5ceb047c-379f-4f59-bf4c-293a9bf7e32b
Palabra clave:
Buenas prácticas
best practices
Diccionario de términos
Term dictionary
Extracción automática de términos
Automatic term extraction
Internet de las cosas
Internet of things
Procesamiento de lenguaje natural
Natural language processing
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
id RepoRIBUC2_ad83428230f2044d2bdf89d628360aed
oai_identifier_str oai:repositorio.ucp.edu.co:10785/15651
network_acronym_str RepoRIBUC2
network_name_str Repositorio Institucional - RIBUC
repository_id_str
dc.title.spa.fl_str_mv Desarrollo de una Herramienta computacional que Permita Realizar Extracción terminológica sobre Literatura Científica en IOT
title Desarrollo de una Herramienta computacional que Permita Realizar Extracción terminológica sobre Literatura Científica en IOT
spellingShingle Desarrollo de una Herramienta computacional que Permita Realizar Extracción terminológica sobre Literatura Científica en IOT
Buenas prácticas
best practices
Diccionario de términos
Term dictionary
Extracción automática de términos
Automatic term extraction
Internet de las cosas
Internet of things
Procesamiento de lenguaje natural
Natural language processing
title_short Desarrollo de una Herramienta computacional que Permita Realizar Extracción terminológica sobre Literatura Científica en IOT
title_full Desarrollo de una Herramienta computacional que Permita Realizar Extracción terminológica sobre Literatura Científica en IOT
title_fullStr Desarrollo de una Herramienta computacional que Permita Realizar Extracción terminológica sobre Literatura Científica en IOT
title_full_unstemmed Desarrollo de una Herramienta computacional que Permita Realizar Extracción terminológica sobre Literatura Científica en IOT
title_sort Desarrollo de una Herramienta computacional que Permita Realizar Extracción terminológica sobre Literatura Científica en IOT
dc.creator.fl_str_mv Morales Ríos, Alejandro
dc.contributor.author.none.fl_str_mv Morales Ríos, Alejandro
dc.subject.spa.fl_str_mv Buenas prácticas
best practices
Diccionario de términos
Term dictionary
Extracción automática de términos
Automatic term extraction
Internet de las cosas
Internet of things
Procesamiento de lenguaje natural
Natural language processing
topic Buenas prácticas
best practices
Diccionario de términos
Term dictionary
Extracción automática de términos
Automatic term extraction
Internet de las cosas
Internet of things
Procesamiento de lenguaje natural
Natural language processing
description Proyecto de aplicación de conocimiento (Ingeniería en Sistemas y Telecomunicaciones), Facultad de Ciencias Básicas e Ingeniería, Pereira, 2023
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2023-09-15T21:22:42Z
dc.date.available.none.fl_str_mv 2023-09-15T21:22:42Z
dc.date.issued.none.fl_str_mv 2023-06-14
dc.type.spa.fl_str_mv Trabajo de Grado – Pregrado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.coarversion.none.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
format http://purl.org/coar/resource_type/c_7a1f
status_str publishedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.ucp.edu.co/entities/publication/5ceb047c-379f-4f59-bf4c-293a9bf7e32b
url https://repositorio.ucp.edu.co/entities/publication/5ceb047c-379f-4f59-bf4c-293a9bf7e32b
dc.language.iso.fl_str_mv spa
language spa
dc.relation.ispartofseries.none.fl_str_mv Monografía ; DDMIST270
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.publisher.spa.fl_str_mv Universidad Católica de Pereira
institution Universidad Católica de Pereira
bitstream.url.fl_str_mv https://repositorio.ucp.edu.co/bitstreams/d7468ca1-11a6-49cc-82d1-ec82de45f9c5/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad Católica de Pereira - RIBUC
repository.mail.fl_str_mv bdigital@metabiblioteca.com
_version_ 1828143393260175360
spelling Morales Ríos, Alejandro2023-09-15T21:22:42Z2023-09-15T21:22:42Z2023-06-14https://repositorio.ucp.edu.co/entities/publication/5ceb047c-379f-4f59-bf4c-293a9bf7e32bProyecto de aplicación de conocimiento (Ingeniería en Sistemas y Telecomunicaciones), Facultad de Ciencias Básicas e Ingeniería, Pereira, 2023La Extracción Automática de Términos es una rama del Procesamiento de Lenguaje Natural (PLN) que emplea métodos lingüísticos y estadísticos para generar materiales lexicográficos por medio de la obtención computarizada de términos. Los materiales lexicográficos permiten el conocimiento riguroso de vocabulario, con esto se busca adquirir nuevos conceptos llamados también unidades léxicas. La literatura especializada resalta la importancia de crear bases comunes para la construcción de teorías unificadas carentes de ambigüedad y para desarrollarlas construyen recursos lexicográficos en forma de vocabularios, diccionarios, glosarios o tesauros. Sin embargo, crear recursos terminológicos manualmente es una tarea costosa en tiempo y dinero, siendo ineficaz debido a la sistematicidad de criterios y volúmenes de información. En este Proyecto de Grado se propone desarrollar una herramienta computacional que permita realizar extracción terminológica sobre literatura científica relacionada con Internet de las cosas (IoT). Se propone una solución mediante un algoritmo híbrido de extracción terminológica en un entorno web y móvil, para generar materiales lexicográficos de manera automática y eficiente, para ello se utiliza una arquitectura Orientada a Servicios (SOA-REST) con herramientas basadas en JavaScript, como React y React Native, así como las librerías NLTK, SpaCy y el framework Flask de Python. Se espera que la herramienta contribuya para la creación de un lenguaje común de términos que sirvan como base para la construcción unificada de teorías, así como contribuir con el modelado de buenas prácticas para la creación de Sistemas IoT. También cabe mencionar que, el trabajo aporta a uno de los objetivos en el marco de un proyecto de investigación en Tecnología IoT, el cual se lleva a cabo en la Universidad Católica de Pereira. Abstract: Automatic Term Extraction is a branch of Natural Language Processing (NLP) that employs linguistic and statistical methods to generate lexicographic materials by means of computerized term retrieval. The lexicographic materials allow the rigorousknowledge of vocabulary, with the aim of acquiring new concepts also called lexical units. The specialized literature highlights the importance of creating common bases for the construction of unified theories lacking ambiguity and to develop them are built lexicographic resources in the form of vocabularies, dictionaries, glossaries, or thesaurus. However, creating terminological resources manually is a costly and time consuming task, being inefficient due to the systematicity of criteria and volumes of information. In this Degree Project we propose to develop a computational tool to perform terminology extraction on scientific literature related to the Internet of Things (IoT). A solution is proposed through a hybrid terminology extraction algorithm in a web and mobile environment, to generate lexicographic materials automatically and efficiently, using a SOA-REST architecture with tools base on JavaScript, as React and React Native, besides NLTK, SpaCy libraries and the Python’s Flask framework. It is expected that the tool will contribute to the creation of a common language of terms that will serve as a basis for the unified construction of theories, as well as contribute to the modelling of good practices for the creation of IoT systems. It is also worth mentioning that the work contributes to one of the objectives within the framework of a research project on IoT Technology, which is development at Universidad Católica de Pereira.Universidad Católica de Pereira. Director de trabajo de grado: Juan Carlos Blandón AndradeUniversidad Católica de PereiraMonografía ; DDMIST270http://creativecommons.org/licenses/by-nc-nd/4.0/deed.esinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Buenas prácticasbest practicesDiccionario de términosTerm dictionaryExtracción automática de términosAutomatic term extractionInternet de las cosasInternet of thingsProcesamiento de lenguaje naturalNatural language processingDesarrollo de una Herramienta computacional que Permita Realizar Extracción terminológica sobre Literatura Científica en IOTTrabajo de Grado – Pregradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionspaPublicationLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucp.edu.co/bitstreams/d7468ca1-11a6-49cc-82d1-ec82de45f9c5/download8a4605be74aa9ea9d79846c1fba20a33MD5510785/15651oai:repositorio.ucp.edu.co:10785/156512025-01-27 16:04:06.599http://creativecommons.org/licenses/by-nc-nd/4.0/deed.esmetadata.onlyhttps://repositorio.ucp.edu.coRepositorio Institucional de la Universidad Católica de Pereira - RIBUCbdigital@metabiblioteca.comTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=