Transformación automática de texto a grafos conceptuales
Dentro de las estructuras computacionales utilizadas para el procesamiento del lenguaje natural, se encuentran los grafos conceptuales (GCs) que por sus ventajas se pueden convertir en un instrumento eficiente para la representación formal del significado del texto. Usualmente los GCs son creados ut...
- Autores:
-
Ordóñez Salinas, Sonia
- Tipo de recurso:
- Doctoral thesis
- Fecha de publicación:
- 2011
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/7653
- Palabra clave:
- 0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Procesamiento de lenguaje natural
Lingüística computacional
Grafos conceptuales
Análisis sintáctico no supervisado
Gramática especializada / Natural language processing
Computational linguistics
Conceptual graphs
Unsupervised parsing
Specialized grammar
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_aaa7015bb1d388b162450db2be303e09 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/7653 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Transformación automática de texto a grafos conceptuales |
title |
Transformación automática de texto a grafos conceptuales |
spellingShingle |
Transformación automática de texto a grafos conceptuales 0 Generalidades / Computer science, information and general works 62 Ingeniería y operaciones afines / Engineering Procesamiento de lenguaje natural Lingüística computacional Grafos conceptuales Análisis sintáctico no supervisado Gramática especializada / Natural language processing Computational linguistics Conceptual graphs Unsupervised parsing Specialized grammar |
title_short |
Transformación automática de texto a grafos conceptuales |
title_full |
Transformación automática de texto a grafos conceptuales |
title_fullStr |
Transformación automática de texto a grafos conceptuales |
title_full_unstemmed |
Transformación automática de texto a grafos conceptuales |
title_sort |
Transformación automática de texto a grafos conceptuales |
dc.creator.fl_str_mv |
Ordóñez Salinas, Sonia |
dc.contributor.author.spa.fl_str_mv |
Ordóñez Salinas, Sonia |
dc.contributor.spa.fl_str_mv |
Gelbukh, Alexander |
dc.subject.ddc.spa.fl_str_mv |
0 Generalidades / Computer science, information and general works 62 Ingeniería y operaciones afines / Engineering |
topic |
0 Generalidades / Computer science, information and general works 62 Ingeniería y operaciones afines / Engineering Procesamiento de lenguaje natural Lingüística computacional Grafos conceptuales Análisis sintáctico no supervisado Gramática especializada / Natural language processing Computational linguistics Conceptual graphs Unsupervised parsing Specialized grammar |
dc.subject.proposal.spa.fl_str_mv |
Procesamiento de lenguaje natural Lingüística computacional Grafos conceptuales Análisis sintáctico no supervisado Gramática especializada / Natural language processing Computational linguistics Conceptual graphs Unsupervised parsing Specialized grammar |
description |
Dentro de las estructuras computacionales utilizadas para el procesamiento del lenguaje natural, se encuentran los grafos conceptuales (GCs) que por sus ventajas se pueden convertir en un instrumento eficiente para la representación formal del significado del texto. Usualmente los GCs son creados utilizando una estructura sintáctica que es modificada hasta obtener los GCs, lo que involucra dos procesos costosos: el análisis sintáctico y la transformación al los GCs. Esta tesis propone dos soluciones más simples para la transformación directa de texto a grafos conceptuales, sin involucrar una estructura intermedia. Una solución es a través de la construcción de una gramática especializada. Dicha gramática se crea de forma automática a partir de un recurso léxico existente construido para otro fin. Otra solución propuesta, es a través del desarrollo de un analizador sintáctico basado en un método estadístico no supervisado y pobre en conocimiento. El método usa las estadísticas de coocurrencia de las palabras en un corpus grande (o en Internet) y permite obtener estructuras simplificadas de GCs. Cabe mencionar que para su entrenamiento no se requiere ningún trabajo manual previo ya que se basa en un corpus no preparado, más aún, sólo se requieren las estadísticas de coocurrencia y no se requiere el acceso al corpus mismo, lo que es importante en el caso del uso de los motores de búsqueda en Internet como la fuente de información estadística. / Abstract. One of the computational structures used in natural language processing is the Conceptual Graphs (CGs), which thanks to their advantages can become an efficient tool for formal representation of the meaning of the text. GCs are usually created using some syntactic structure that is modified to obtain the CGs. This involves two costly processes: parsing and transformation to the CGs. This thesis proposes two simpler solutions for converting text to conceptual graphs directly, without involving an intermediate structure. One solution is through the construction of a specialized grammar. This grammar is automatically created from an existing lexical resource that has been built for another purpose. The other proposed solution is through the development of a parser based on a knowledge-poor unsupervised statistical method. The method uses co-occurrence statistics of words in a large corpus (or Internet) and generates simplified CG-like structures. It should be mentioned that the training process does not require any previous manual work because it is based on a raw text corpus. Moreover, it only requires the co-occurrence statistics and does not require access to the corpus itself, which is important for the use of Internet search engines as the source of statistical information. |
publishDate |
2011 |
dc.date.issued.spa.fl_str_mv |
2011 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-24T16:53:41Z |
dc.date.available.spa.fl_str_mv |
2019-06-24T16:53:41Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Doctorado |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_db06 |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TD |
format |
http://purl.org/coar/resource_type/c_db06 |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/7653 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/4095/ |
url |
https://repositorio.unal.edu.co/handle/unal/7653 http://bdigital.unal.edu.co/4095/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial Departamento de Ingeniería de Sistemas e Industrial |
dc.relation.references.spa.fl_str_mv |
Ordóñez Salinas, Sonia (2011) Transformación automática de texto a grafos conceptuales. Doctorado thesis, Universidad Nacional de Colombia. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/7653/1/soniaordonezsalinas.2011.pdf https://repositorio.unal.edu.co/bitstream/unal/7653/2/soniaordonezsalinas.2011.pdf.jpg |
bitstream.checksum.fl_str_mv |
06c9a347f11c8e7482641b472eb8efdf 94cee92116e571f43a13de849f2585fd |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089971209863168 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Gelbukh, AlexanderOrdóñez Salinas, Sonia1d8e09be-df65-4947-b7c8-5982830cebce3002019-06-24T16:53:41Z2019-06-24T16:53:41Z2011https://repositorio.unal.edu.co/handle/unal/7653http://bdigital.unal.edu.co/4095/Dentro de las estructuras computacionales utilizadas para el procesamiento del lenguaje natural, se encuentran los grafos conceptuales (GCs) que por sus ventajas se pueden convertir en un instrumento eficiente para la representación formal del significado del texto. Usualmente los GCs son creados utilizando una estructura sintáctica que es modificada hasta obtener los GCs, lo que involucra dos procesos costosos: el análisis sintáctico y la transformación al los GCs. Esta tesis propone dos soluciones más simples para la transformación directa de texto a grafos conceptuales, sin involucrar una estructura intermedia. Una solución es a través de la construcción de una gramática especializada. Dicha gramática se crea de forma automática a partir de un recurso léxico existente construido para otro fin. Otra solución propuesta, es a través del desarrollo de un analizador sintáctico basado en un método estadístico no supervisado y pobre en conocimiento. El método usa las estadísticas de coocurrencia de las palabras en un corpus grande (o en Internet) y permite obtener estructuras simplificadas de GCs. Cabe mencionar que para su entrenamiento no se requiere ningún trabajo manual previo ya que se basa en un corpus no preparado, más aún, sólo se requieren las estadísticas de coocurrencia y no se requiere el acceso al corpus mismo, lo que es importante en el caso del uso de los motores de búsqueda en Internet como la fuente de información estadística. / Abstract. One of the computational structures used in natural language processing is the Conceptual Graphs (CGs), which thanks to their advantages can become an efficient tool for formal representation of the meaning of the text. GCs are usually created using some syntactic structure that is modified to obtain the CGs. This involves two costly processes: parsing and transformation to the CGs. This thesis proposes two simpler solutions for converting text to conceptual graphs directly, without involving an intermediate structure. One solution is through the construction of a specialized grammar. This grammar is automatically created from an existing lexical resource that has been built for another purpose. The other proposed solution is through the development of a parser based on a knowledge-poor unsupervised statistical method. The method uses co-occurrence statistics of words in a large corpus (or Internet) and generates simplified CG-like structures. It should be mentioned that the training process does not require any previous manual work because it is based on a raw text corpus. Moreover, it only requires the co-occurrence statistics and does not require access to the corpus itself, which is important for the use of Internet search engines as the source of statistical information.Doctoradoapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e IndustrialDepartamento de Ingeniería de Sistemas e IndustrialOrdóñez Salinas, Sonia (2011) Transformación automática de texto a grafos conceptuales. Doctorado thesis, Universidad Nacional de Colombia.0 Generalidades / Computer science, information and general works62 Ingeniería y operaciones afines / EngineeringProcesamiento de lenguaje naturalLingüística computacionalGrafos conceptualesAnálisis sintáctico no supervisadoGramática especializada / Natural language processingComputational linguisticsConceptual graphsUnsupervised parsingSpecialized grammarTransformación automática de texto a grafos conceptualesTrabajo de grado - Doctoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06Texthttp://purl.org/redcol/resource_type/TDORIGINALsoniaordonezsalinas.2011.pdfapplication/pdf2522249https://repositorio.unal.edu.co/bitstream/unal/7653/1/soniaordonezsalinas.2011.pdf06c9a347f11c8e7482641b472eb8efdfMD51THUMBNAILsoniaordonezsalinas.2011.pdf.jpgsoniaordonezsalinas.2011.pdf.jpgGenerated Thumbnailimage/jpeg3729https://repositorio.unal.edu.co/bitstream/unal/7653/2/soniaordonezsalinas.2011.pdf.jpg94cee92116e571f43a13de849f2585fdMD52unal/7653oai:repositorio.unal.edu.co:unal/76532022-10-31 18:26:19.797Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |