Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español
Recientemente el análisis de sentimientos (AS) ha mostrado un alto interés debido a la producción a gran escala de opiniones por parte de usuarios en la Internet. Las empresas en general, necesitan saber la reputación que tienen ante sus usuarios en la Web. Hasta ahora, la gran mayoría de trabajos d...
- Autores:
-
Henriquez Miranda, Carlos Nelson
- Tipo de recurso:
- Doctoral thesis
- Fecha de publicación:
- 1997
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/61028
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/61028
http://bdigital.unal.edu.co/59833/
- Palabra clave:
- 03 Obras enciclopédicas generales / Encyclopedias and books of facts
Análisis de sentimientos a nivel de aspectos
Ontologías
Aprendizaje de máquina no supervisado.
Aspect-Based Sentiment Analysis
Ontology
Unsupervised machine learning
Opinion mining
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_565546c638f1c9dfe27760b4747fb97d |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/61028 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español |
title |
Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español |
spellingShingle |
Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español 03 Obras enciclopédicas generales / Encyclopedias and books of facts Análisis de sentimientos a nivel de aspectos Ontologías Aprendizaje de máquina no supervisado. Aspect-Based Sentiment Analysis Ontology Unsupervised machine learning Opinion mining |
title_short |
Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español |
title_full |
Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español |
title_fullStr |
Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español |
title_full_unstemmed |
Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español |
title_sort |
Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español |
dc.creator.fl_str_mv |
Henriquez Miranda, Carlos Nelson |
dc.contributor.author.spa.fl_str_mv |
Henriquez Miranda, Carlos Nelson |
dc.contributor.spa.fl_str_mv |
Guzman Luna, Jaime Alberto |
dc.subject.ddc.spa.fl_str_mv |
03 Obras enciclopédicas generales / Encyclopedias and books of facts |
topic |
03 Obras enciclopédicas generales / Encyclopedias and books of facts Análisis de sentimientos a nivel de aspectos Ontologías Aprendizaje de máquina no supervisado. Aspect-Based Sentiment Analysis Ontology Unsupervised machine learning Opinion mining |
dc.subject.proposal.spa.fl_str_mv |
Análisis de sentimientos a nivel de aspectos Ontologías Aprendizaje de máquina no supervisado. Aspect-Based Sentiment Analysis Ontology Unsupervised machine learning Opinion mining |
description |
Recientemente el análisis de sentimientos (AS) ha mostrado un alto interés debido a la producción a gran escala de opiniones por parte de usuarios en la Internet. Las empresas en general, necesitan saber la reputación que tienen ante sus usuarios en la Web. Hasta ahora, la gran mayoría de trabajos de investigación involucran sistemas de AS que detectan el sentimiento global de una opinión escrita sobre una frase o un documento completo; estos sistemas resultan a veces incompletos ante la realidad de las organizaciones que quieren saber en detalle el comportamiento de sus productos. Resultados de esa necesidad, existen enfoques de AS dedicados a realizar un análisis más completo de grano fino, en donde se identifican las características o aspectos más importantes de una opinión para poder determinar el sentimiento de cada uno de los aspectos. Sin embargo, la mayoría de enfoques, no tienen en cuenta el concepto o significado de las palabras en el proceso de identificar los aspectos, por otra parte, se necesita un gran número de documentos etiquetados manualmente para determinar el sentimiento. Con el fin de dar solución a estos problemas, este trabajo de tesis doctoral, propone la construcción de un modelo para analizar sentimientos a nivel de aspectos en español, que permita extraer automáticamente las características de una opinión y determinar el sentimiento (polaridad) asociado. El modelo está basado en dos técnicas, la primera se basa en ontologías para detección aspectos explícitos e implícitos y la segunda, utiliza el aprendizaje de máquina no supervisado para determinar la polaridad sobre una estructura gramatical simple. Este modelo tiene en cuenta el significado de los aspectos en el momento de extracción, y es completamente no supervisado, lo que permite implementar un sistema que sea rápidamente escalable a cualquier idioma o dominio. Para la implementación del modelo, se desarrolló el prototipo AspectSA (elaborado en JAVA), que contiene componentes de software que permiten realizar el análisis de sentimientos a nivel de aspectos en los dominios de restaurante y hoteles. Adicionalmente, este prototipo se validó utilizando un conjunto de experimentos basados en corpus, desarrollados por SemEval 2016 en español. Los resultados obtenidos superaron a todos los participantes de SemEval y a los sistemas existentes para el lenguaje español. |
publishDate |
1997 |
dc.date.issued.spa.fl_str_mv |
1997 |
dc.date.accessioned.spa.fl_str_mv |
2019-07-02T19:44:05Z |
dc.date.available.spa.fl_str_mv |
2019-07-02T19:44:05Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Doctorado |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_db06 |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TD |
format |
http://purl.org/coar/resource_type/c_db06 |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/61028 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/59833/ |
url |
https://repositorio.unal.edu.co/handle/unal/61028 http://bdigital.unal.edu.co/59833/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Medellín Facultad de Minas Escuela de Sistemas Ingeniería de Sistemas e Informática Ingeniería de Sistemas e Informática |
dc.relation.references.spa.fl_str_mv |
Henriquez Miranda, Carlos Nelson (1997) Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español. Doctorado thesis, Universidad Nacional de Colombia - Sede Medellín. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/61028/1/72192582.2017.pdf https://repositorio.unal.edu.co/bitstream/unal/61028/2/72192582.2017.pdf.jpg |
bitstream.checksum.fl_str_mv |
cb18200a9c6fe7fa58ee3d30defdb432 19f922f439df2bc1db9194cf129387a2 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089939496730624 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Guzman Luna, Jaime AlbertoHenriquez Miranda, Carlos Nelsonac34eb97-3b8d-470e-86aa-47c32aa15a923002019-07-02T19:44:05Z2019-07-02T19:44:05Z1997https://repositorio.unal.edu.co/handle/unal/61028http://bdigital.unal.edu.co/59833/Recientemente el análisis de sentimientos (AS) ha mostrado un alto interés debido a la producción a gran escala de opiniones por parte de usuarios en la Internet. Las empresas en general, necesitan saber la reputación que tienen ante sus usuarios en la Web. Hasta ahora, la gran mayoría de trabajos de investigación involucran sistemas de AS que detectan el sentimiento global de una opinión escrita sobre una frase o un documento completo; estos sistemas resultan a veces incompletos ante la realidad de las organizaciones que quieren saber en detalle el comportamiento de sus productos. Resultados de esa necesidad, existen enfoques de AS dedicados a realizar un análisis más completo de grano fino, en donde se identifican las características o aspectos más importantes de una opinión para poder determinar el sentimiento de cada uno de los aspectos. Sin embargo, la mayoría de enfoques, no tienen en cuenta el concepto o significado de las palabras en el proceso de identificar los aspectos, por otra parte, se necesita un gran número de documentos etiquetados manualmente para determinar el sentimiento. Con el fin de dar solución a estos problemas, este trabajo de tesis doctoral, propone la construcción de un modelo para analizar sentimientos a nivel de aspectos en español, que permita extraer automáticamente las características de una opinión y determinar el sentimiento (polaridad) asociado. El modelo está basado en dos técnicas, la primera se basa en ontologías para detección aspectos explícitos e implícitos y la segunda, utiliza el aprendizaje de máquina no supervisado para determinar la polaridad sobre una estructura gramatical simple. Este modelo tiene en cuenta el significado de los aspectos en el momento de extracción, y es completamente no supervisado, lo que permite implementar un sistema que sea rápidamente escalable a cualquier idioma o dominio. Para la implementación del modelo, se desarrolló el prototipo AspectSA (elaborado en JAVA), que contiene componentes de software que permiten realizar el análisis de sentimientos a nivel de aspectos en los dominios de restaurante y hoteles. Adicionalmente, este prototipo se validó utilizando un conjunto de experimentos basados en corpus, desarrollados por SemEval 2016 en español. Los resultados obtenidos superaron a todos los participantes de SemEval y a los sistemas existentes para el lenguaje español.Abstract: Recently the sentiment analysis has shown a high interest due to large-scale production of opinions by users on the Internet. The companies generally need to know the reputation they have of their users on the Web. So far, the vast majority of research involving this systems that detect the overall sentiment of a written opinion on a phrase or an entire document. These systems are sometimes incomplete before the reality of organizations that want to know in detail the behavior of their products. Due to the above, there are some approaches dedicated to a more complete analysis offine grain, where the characteristics or most important aspects of an opinion are identified in order to determine the feeling of each one of the aspects. However, most approaches do not take into account the concept or meaning of words in the process of identifying aspects and also a large number of documents labeled manually is needed to determine the sentiment. In order to solve these problems, this doctoral thesis proposes the construction of a model to aspect-based sentiment analysis in Spanish that allows to automatically extract the characteristics of an opinion and determine the associated sentiment (polarity). The model is based on Ontologies for detection of characteristics (explicit and implicit aspects) and machine learning unsupervised to determine the polarity on a simple grammatical structure. This model takes into account the meaning of the aspects at the time of extraction and is completely unsupervised which allows to implement a system that is quickly scalable to any language or domain. For the implementation of the model was developed the prototype AspectSA (elaborated in JAVA), which contains software components that allow the aspect-based sentiment analysis in the domains of restaurants and hotels. In addition, this prototype was validated using a set of experiments based on the data set developed by SemEval 2016 in Spanish. The results obtained exceeded all SemEval participants and the existing systems for the Spanish language.Doctoradoapplication/pdfspaUniversidad Nacional de Colombia Sede Medellín Facultad de Minas Escuela de Sistemas Ingeniería de Sistemas e InformáticaIngeniería de Sistemas e InformáticaHenriquez Miranda, Carlos Nelson (1997) Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español. Doctorado thesis, Universidad Nacional de Colombia - Sede Medellín.03 Obras enciclopédicas generales / Encyclopedias and books of factsAnálisis de sentimientos a nivel de aspectosOntologíasAprendizaje de máquina no supervisado.Aspect-Based Sentiment AnalysisOntologyUnsupervised machine learningOpinion miningUn modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en españolTrabajo de grado - Doctoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06Texthttp://purl.org/redcol/resource_type/TDORIGINAL72192582.2017.pdfTesis de Doctorado en Ingeniería - Sistemasapplication/pdf5705070https://repositorio.unal.edu.co/bitstream/unal/61028/1/72192582.2017.pdfcb18200a9c6fe7fa58ee3d30defdb432MD51THUMBNAIL72192582.2017.pdf.jpg72192582.2017.pdf.jpgGenerated Thumbnailimage/jpeg6227https://repositorio.unal.edu.co/bitstream/unal/61028/2/72192582.2017.pdf.jpg19f922f439df2bc1db9194cf129387a2MD52unal/61028oai:repositorio.unal.edu.co:unal/610282024-04-16 23:34:38.642Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |