Transformación automática de texto a grafos conceptuales

Dentro de las estructuras computacionales utilizadas para el procesamiento del lenguaje natural, se encuentran los grafos conceptuales (GCs) que por sus ventajas se pueden convertir en un instrumento eficiente para la representación formal del significado del texto. Usualmente los GCs son creados ut...

Full description

Autores:
Ordóñez Salinas, Sonia
Tipo de recurso:
Doctoral thesis
Fecha de publicación:
2011
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/7653
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/7653
http://bdigital.unal.edu.co/4095/
Palabra clave:
0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Procesamiento de lenguaje natural
Lingüística computacional
Grafos conceptuales
Análisis sintáctico no supervisado
Gramática especializada / Natural language processing
Computational linguistics
Conceptual graphs
Unsupervised parsing
Specialized grammar
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_aaa7015bb1d388b162450db2be303e09
oai_identifier_str oai:repositorio.unal.edu.co:unal/7653
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Transformación automática de texto a grafos conceptuales
title Transformación automática de texto a grafos conceptuales
spellingShingle Transformación automática de texto a grafos conceptuales
0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Procesamiento de lenguaje natural
Lingüística computacional
Grafos conceptuales
Análisis sintáctico no supervisado
Gramática especializada / Natural language processing
Computational linguistics
Conceptual graphs
Unsupervised parsing
Specialized grammar
title_short Transformación automática de texto a grafos conceptuales
title_full Transformación automática de texto a grafos conceptuales
title_fullStr Transformación automática de texto a grafos conceptuales
title_full_unstemmed Transformación automática de texto a grafos conceptuales
title_sort Transformación automática de texto a grafos conceptuales
dc.creator.fl_str_mv Ordóñez Salinas, Sonia
dc.contributor.author.spa.fl_str_mv Ordóñez Salinas, Sonia
dc.contributor.spa.fl_str_mv Gelbukh, Alexander
dc.subject.ddc.spa.fl_str_mv 0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
topic 0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Procesamiento de lenguaje natural
Lingüística computacional
Grafos conceptuales
Análisis sintáctico no supervisado
Gramática especializada / Natural language processing
Computational linguistics
Conceptual graphs
Unsupervised parsing
Specialized grammar
dc.subject.proposal.spa.fl_str_mv Procesamiento de lenguaje natural
Lingüística computacional
Grafos conceptuales
Análisis sintáctico no supervisado
Gramática especializada / Natural language processing
Computational linguistics
Conceptual graphs
Unsupervised parsing
Specialized grammar
description Dentro de las estructuras computacionales utilizadas para el procesamiento del lenguaje natural, se encuentran los grafos conceptuales (GCs) que por sus ventajas se pueden convertir en un instrumento eficiente para la representación formal del significado del texto. Usualmente los GCs son creados utilizando una estructura sintáctica que es modificada hasta obtener los GCs, lo que involucra dos procesos costosos: el análisis sintáctico y la transformación al los GCs. Esta tesis propone dos soluciones más simples para la transformación directa de texto a grafos conceptuales, sin involucrar una estructura intermedia. Una solución es a través de la construcción de una gramática especializada. Dicha gramática se crea de forma automática a partir de un recurso léxico existente construido para otro fin. Otra solución propuesta, es a través del desarrollo de un analizador sintáctico basado en un método estadístico no supervisado y pobre en conocimiento. El método usa las estadísticas de coocurrencia de las palabras en un corpus grande (o en Internet) y permite obtener estructuras simplificadas de GCs. Cabe mencionar que para su entrenamiento no se requiere ningún trabajo manual previo ya que se basa en un corpus no preparado, más aún, sólo se requieren las estadísticas de coocurrencia y no se requiere el acceso al corpus mismo, lo que es importante en el caso del uso de los motores de búsqueda en Internet como la fuente de información estadística. / Abstract. One of the computational structures used in natural language processing is the Conceptual Graphs (CGs), which thanks to their advantages can become an efficient tool for formal representation of the meaning of the text. GCs are usually created using some syntactic structure that is modified to obtain the CGs. This involves two costly processes: parsing and transformation to the CGs. This thesis proposes two simpler solutions for converting text to conceptual graphs directly, without involving an intermediate structure. One solution is through the construction of a specialized grammar. This grammar is automatically created from an existing lexical resource that has been built for another purpose. The other proposed solution is through the development of a parser based on a knowledge-poor unsupervised statistical method. The method uses co-occurrence statistics of words in a large corpus (or Internet) and generates simplified CG-like structures. It should be mentioned that the training process does not require any previous manual work because it is based on a raw text corpus. Moreover, it only requires the co-occurrence statistics and does not require access to the corpus itself, which is important for the use of Internet search engines as the source of statistical information.
publishDate 2011
dc.date.issued.spa.fl_str_mv 2011
dc.date.accessioned.spa.fl_str_mv 2019-06-24T16:53:41Z
dc.date.available.spa.fl_str_mv 2019-06-24T16:53:41Z
dc.type.spa.fl_str_mv Trabajo de grado - Doctorado
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/doctoralThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_db06
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TD
format http://purl.org/coar/resource_type/c_db06
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/7653
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/4095/
url https://repositorio.unal.edu.co/handle/unal/7653
http://bdigital.unal.edu.co/4095/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial
Departamento de Ingeniería de Sistemas e Industrial
dc.relation.references.spa.fl_str_mv Ordóñez Salinas, Sonia (2011) Transformación automática de texto a grafos conceptuales. Doctorado thesis, Universidad Nacional de Colombia.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/7653/1/soniaordonezsalinas.2011.pdf
https://repositorio.unal.edu.co/bitstream/unal/7653/2/soniaordonezsalinas.2011.pdf.jpg
bitstream.checksum.fl_str_mv 06c9a347f11c8e7482641b472eb8efdf
94cee92116e571f43a13de849f2585fd
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1806886529932460032
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Gelbukh, AlexanderOrdóñez Salinas, Sonia1d8e09be-df65-4947-b7c8-5982830cebce3002019-06-24T16:53:41Z2019-06-24T16:53:41Z2011https://repositorio.unal.edu.co/handle/unal/7653http://bdigital.unal.edu.co/4095/Dentro de las estructuras computacionales utilizadas para el procesamiento del lenguaje natural, se encuentran los grafos conceptuales (GCs) que por sus ventajas se pueden convertir en un instrumento eficiente para la representación formal del significado del texto. Usualmente los GCs son creados utilizando una estructura sintáctica que es modificada hasta obtener los GCs, lo que involucra dos procesos costosos: el análisis sintáctico y la transformación al los GCs. Esta tesis propone dos soluciones más simples para la transformación directa de texto a grafos conceptuales, sin involucrar una estructura intermedia. Una solución es a través de la construcción de una gramática especializada. Dicha gramática se crea de forma automática a partir de un recurso léxico existente construido para otro fin. Otra solución propuesta, es a través del desarrollo de un analizador sintáctico basado en un método estadístico no supervisado y pobre en conocimiento. El método usa las estadísticas de coocurrencia de las palabras en un corpus grande (o en Internet) y permite obtener estructuras simplificadas de GCs. Cabe mencionar que para su entrenamiento no se requiere ningún trabajo manual previo ya que se basa en un corpus no preparado, más aún, sólo se requieren las estadísticas de coocurrencia y no se requiere el acceso al corpus mismo, lo que es importante en el caso del uso de los motores de búsqueda en Internet como la fuente de información estadística. / Abstract. One of the computational structures used in natural language processing is the Conceptual Graphs (CGs), which thanks to their advantages can become an efficient tool for formal representation of the meaning of the text. GCs are usually created using some syntactic structure that is modified to obtain the CGs. This involves two costly processes: parsing and transformation to the CGs. This thesis proposes two simpler solutions for converting text to conceptual graphs directly, without involving an intermediate structure. One solution is through the construction of a specialized grammar. This grammar is automatically created from an existing lexical resource that has been built for another purpose. The other proposed solution is through the development of a parser based on a knowledge-poor unsupervised statistical method. The method uses co-occurrence statistics of words in a large corpus (or Internet) and generates simplified CG-like structures. It should be mentioned that the training process does not require any previous manual work because it is based on a raw text corpus. Moreover, it only requires the co-occurrence statistics and does not require access to the corpus itself, which is important for the use of Internet search engines as the source of statistical information.Doctoradoapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e IndustrialDepartamento de Ingeniería de Sistemas e IndustrialOrdóñez Salinas, Sonia (2011) Transformación automática de texto a grafos conceptuales. Doctorado thesis, Universidad Nacional de Colombia.0 Generalidades / Computer science, information and general works62 Ingeniería y operaciones afines / EngineeringProcesamiento de lenguaje naturalLingüística computacionalGrafos conceptualesAnálisis sintáctico no supervisadoGramática especializada / Natural language processingComputational linguisticsConceptual graphsUnsupervised parsingSpecialized grammarTransformación automática de texto a grafos conceptualesTrabajo de grado - Doctoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06Texthttp://purl.org/redcol/resource_type/TDORIGINALsoniaordonezsalinas.2011.pdfapplication/pdf2522249https://repositorio.unal.edu.co/bitstream/unal/7653/1/soniaordonezsalinas.2011.pdf06c9a347f11c8e7482641b472eb8efdfMD51THUMBNAILsoniaordonezsalinas.2011.pdf.jpgsoniaordonezsalinas.2011.pdf.jpgGenerated Thumbnailimage/jpeg3729https://repositorio.unal.edu.co/bitstream/unal/7653/2/soniaordonezsalinas.2011.pdf.jpg94cee92116e571f43a13de849f2585fdMD52unal/7653oai:repositorio.unal.edu.co:unal/76532022-10-31 18:26:19.797Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co