Técnicas de minería de texto aplicadas para la identificación de grupos de patentes afines en la industria del cacao

En la última década el número de patentes ha aumentado cada vez más rápido, y la cantidad de información técnica contenida en ellas dificulta su análisis. Los documentos de patentes permiten la generación de grandes cantidades de datos no estructurados, que pueden procesarse con la ayuda de diferent...

Full description

Autores:
Rodríguez Millán, Paola Milena
Tipo de recurso:
http://purl.org/coar/version/c_b1a7d7d4d402bcce
Fecha de publicación:
2020
Institución:
Universidad Industrial de Santander
Repositorio:
Repositorio UIS
Idioma:
spa
OAI Identifier:
oai:noesis.uis.edu.co:20.500.14071/40226
Acceso en línea:
https://noesis.uis.edu.co/handle/20.500.14071/40226
https://noesis.uis.edu.co
Palabra clave:
Minería de Texto
Análisis de Patentes
K-means
Cacao.
Text Mining
Patent Analysis
K-means
Cocoa.
Rights
License
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
id UISANTADR2_74fca56c669554f7c13b4d1750f2dc9f
oai_identifier_str oai:noesis.uis.edu.co:20.500.14071/40226
network_acronym_str UISANTADR2
network_name_str Repositorio UIS
repository_id_str
dc.title.none.fl_str_mv Técnicas de minería de texto aplicadas para la identificación de grupos de patentes afines en la industria del cacao
dc.title.english.none.fl_str_mv Text mining techniques applied to identify groups of related patents in the cocoa industry*
title Técnicas de minería de texto aplicadas para la identificación de grupos de patentes afines en la industria del cacao
spellingShingle Técnicas de minería de texto aplicadas para la identificación de grupos de patentes afines en la industria del cacao
Minería de Texto
Análisis de Patentes
K-means
Cacao.
Text Mining
Patent Analysis
K-means
Cocoa.
title_short Técnicas de minería de texto aplicadas para la identificación de grupos de patentes afines en la industria del cacao
title_full Técnicas de minería de texto aplicadas para la identificación de grupos de patentes afines en la industria del cacao
title_fullStr Técnicas de minería de texto aplicadas para la identificación de grupos de patentes afines en la industria del cacao
title_full_unstemmed Técnicas de minería de texto aplicadas para la identificación de grupos de patentes afines en la industria del cacao
title_sort Técnicas de minería de texto aplicadas para la identificación de grupos de patentes afines en la industria del cacao
dc.creator.fl_str_mv Rodríguez Millán, Paola Milena
dc.contributor.advisor.none.fl_str_mv Talero Sarmiento, Leonardo Hernán
Lamos Díaz, Henry
Cárdenas Solano, Leidy Johanna
dc.contributor.author.none.fl_str_mv Rodríguez Millán, Paola Milena
dc.subject.none.fl_str_mv Minería de Texto
Análisis de Patentes
K-means
Cacao.
topic Minería de Texto
Análisis de Patentes
K-means
Cacao.
Text Mining
Patent Analysis
K-means
Cocoa.
dc.subject.keyword.none.fl_str_mv Text Mining
Patent Analysis
K-means
Cocoa.
description En la última década el número de patentes ha aumentado cada vez más rápido, y la cantidad de información técnica contenida en ellas dificulta su análisis. Los documentos de patentes permiten la generación de grandes cantidades de datos no estructurados, que pueden procesarse con la ayuda de diferentes técnicas de minería de textos. Las bases de datos de patentes disponibles, a través de su interfaz, permite la inclusión y exclusión de aplicaciones estándar en las ecuaciones de búsqueda, posibilitando la extracción efectiva de los datos requeridos para el análisis, dando paso a la aplicación de herramientas automatizadas con el fin de identificar relaciones y tendencias que pueden mejorar la ventaja competitiva. El presente trabajo de investigación tiene como objetivo la identificación de grupos de patentes afines en la industria del cacao por medio de una minería de texto, donde se aplicó una metodología de agrupamiento de documentos no supervisada, basada en datos no estructurados para los que se lleva a cabo un preprocesamiento de los datos, luego se genera un corpus como espacio vectorial de los documentos de patentes, una representación de TF-IDF para finalmente aplicar la técnica de agrupamiento k-means, que permitió identificar relaciones entre las patentes y los grupos generados.
publishDate 2020
dc.date.available.none.fl_str_mv 2020
2024-03-04T00:43:59Z
dc.date.created.none.fl_str_mv 2020
dc.date.issued.none.fl_str_mv 2020
dc.date.accessioned.none.fl_str_mv 2024-03-04T00:43:59Z
dc.type.local.none.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.hasversion.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.coar.none.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
format http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.identifier.uri.none.fl_str_mv https://noesis.uis.edu.co/handle/20.500.14071/40226
dc.identifier.instname.none.fl_str_mv Universidad Industrial de Santander
dc.identifier.reponame.none.fl_str_mv Universidad Industrial de Santander
dc.identifier.repourl.none.fl_str_mv https://noesis.uis.edu.co
url https://noesis.uis.edu.co/handle/20.500.14071/40226
https://noesis.uis.edu.co
identifier_str_mv Universidad Industrial de Santander
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv http://creativecommons.org/licenses/by/4.0/
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.none.fl_str_mv Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0
dc.rights.creativecommons.none.fl_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
rights_invalid_str_mv Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
http://creativecommons.org/licenses/by/4.0/
http://creativecommons.org/licenses/by-nc/4.0
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Industrial de Santander
dc.publisher.faculty.none.fl_str_mv Facultad de Ingenierías Fisicomecánicas
dc.publisher.program.none.fl_str_mv Ingeniería Industrial
dc.publisher.school.none.fl_str_mv Escuela de Estudios Industriales y Empresariales
publisher.none.fl_str_mv Universidad Industrial de Santander
institution Universidad Industrial de Santander
bitstream.url.fl_str_mv https://noesis.uis.edu.co/bitstreams/2984c592-e216-4a34-a5ae-c7f8a0b28e0d/download
https://noesis.uis.edu.co/bitstreams/579a2ab4-568b-4f70-ad7a-2a57c288c660/download
https://noesis.uis.edu.co/bitstreams/a9fbb9e8-579f-4187-982e-dea8e56227de/download
bitstream.checksum.fl_str_mv ae4cd4eb754804510fd89e6ea0dc55de
c653dbe0d876d046fb04d509aec74e00
8cd7ed760ae0aead67ef31b0a226f523
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv DSpace at UIS
repository.mail.fl_str_mv noesis@uis.edu.co
_version_ 1814095239627931648
spelling Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)http://creativecommons.org/licenses/by/4.0/http://creativecommons.org/licenses/by-nc/4.0Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)http://purl.org/coar/access_right/c_abf2Talero Sarmiento, Leonardo HernánLamos Díaz, HenryCárdenas Solano, Leidy JohannaRodríguez Millán, Paola Milena2024-03-04T00:43:59Z20202024-03-04T00:43:59Z20202020https://noesis.uis.edu.co/handle/20.500.14071/40226Universidad Industrial de SantanderUniversidad Industrial de Santanderhttps://noesis.uis.edu.coEn la última década el número de patentes ha aumentado cada vez más rápido, y la cantidad de información técnica contenida en ellas dificulta su análisis. Los documentos de patentes permiten la generación de grandes cantidades de datos no estructurados, que pueden procesarse con la ayuda de diferentes técnicas de minería de textos. Las bases de datos de patentes disponibles, a través de su interfaz, permite la inclusión y exclusión de aplicaciones estándar en las ecuaciones de búsqueda, posibilitando la extracción efectiva de los datos requeridos para el análisis, dando paso a la aplicación de herramientas automatizadas con el fin de identificar relaciones y tendencias que pueden mejorar la ventaja competitiva. El presente trabajo de investigación tiene como objetivo la identificación de grupos de patentes afines en la industria del cacao por medio de una minería de texto, donde se aplicó una metodología de agrupamiento de documentos no supervisada, basada en datos no estructurados para los que se lleva a cabo un preprocesamiento de los datos, luego se genera un corpus como espacio vectorial de los documentos de patentes, una representación de TF-IDF para finalmente aplicar la técnica de agrupamiento k-means, que permitió identificar relaciones entre las patentes y los grupos generados.PregradoIngeniero IndustrialIn the last decade the number of patents has increased faster and faster, and the amount of technical information contained in them makes their analysis difficult. Patent documents allow the generation of large amounts of unstructured data, which can be processed with the help of text mining techniques. The patent databases, through their interface, allows the inclusion and exclusion of standard applications in the search equations, enabling the effective extraction of the data required for the analysis, giving way to the application of automated tools in order to identify relationships and trends that can improve competitive advantage. The objective of this research work is to identify groups of related patents in the cocoa industry through text mining, where an unsupervised document grouping methodology was applied, based on unstructured data for which it is carried out. carry out a preprocessing of the data, then a corpus is generated as a vector space of the patent documents, a representation of TF-IDF to finally apply the k-means grouping technique, which seeks to identify relationships between the patents and the generated groups.application/pdfspaUniversidad Industrial de SantanderFacultad de Ingenierías FisicomecánicasIngeniería IndustrialEscuela de Estudios Industriales y EmpresarialesMinería de TextoAnálisis de PatentesK-meansCacao.Text MiningPatent AnalysisK-meansCocoa.Técnicas de minería de texto aplicadas para la identificación de grupos de patentes afines en la industria del cacaoText mining techniques applied to identify groups of related patents in the cocoa industry*Tesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_b1a7d7d4d402bcceORIGINALCarta de autorización.pdfapplication/pdf123377https://noesis.uis.edu.co/bitstreams/2984c592-e216-4a34-a5ae-c7f8a0b28e0d/downloadae4cd4eb754804510fd89e6ea0dc55deMD51Documento.pdfapplication/pdf1972129https://noesis.uis.edu.co/bitstreams/579a2ab4-568b-4f70-ad7a-2a57c288c660/downloadc653dbe0d876d046fb04d509aec74e00MD52Nota de proyecto.pdfapplication/pdf55979https://noesis.uis.edu.co/bitstreams/a9fbb9e8-579f-4187-982e-dea8e56227de/download8cd7ed760ae0aead67ef31b0a226f523MD5320.500.14071/40226oai:noesis.uis.edu.co:20.500.14071/402262024-03-03 19:43:59.799http://creativecommons.org/licenses/by-nc/4.0http://creativecommons.org/licenses/by/4.0/open.accesshttps://noesis.uis.edu.coDSpace at UISnoesis@uis.edu.co