Generación automática de resúmenes extractivos de múltiples documentos basada en algoritmos meméticos

Recientemente los algoritmos basados en metaheurísticas han mostrado buenos resultados para generar resúmenes automáticos comparados con otros métodos del estado del arte, sin embargo, aunque los algoritmos meméticos han contribuido en la resolución de diversos problemas de optimización combinatoria...

Full description

Autores:
Mendoza Becerra, Martha Eliana
Tipo de recurso:
Doctoral thesis
Fecha de publicación:
2015
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/56120
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/56120
http://bdigital.unal.edu.co/51728/
Palabra clave:
0 Generalidades / Computer science, information and general works
Generación automática de resúmenes de un solo documento
Generación automática de resúmenes de múltiples documentos
Algoritmos meméticos
Búsqueda local guiada
Búsqueda local codiciosa
Extractive single-document summarization
Extractive multi-document summarization
Memetic algorithms
Guided local search
Greedy local search
Rights
restrictedAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_7694674c499c70f961040cf96b78a58d
oai_identifier_str oai:repositorio.unal.edu.co:unal/56120
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Generación automática de resúmenes extractivos de múltiples documentos basada en algoritmos meméticos
title Generación automática de resúmenes extractivos de múltiples documentos basada en algoritmos meméticos
spellingShingle Generación automática de resúmenes extractivos de múltiples documentos basada en algoritmos meméticos
0 Generalidades / Computer science, information and general works
Generación automática de resúmenes de un solo documento
Generación automática de resúmenes de múltiples documentos
Algoritmos meméticos
Búsqueda local guiada
Búsqueda local codiciosa
Extractive single-document summarization
Extractive multi-document summarization
Memetic algorithms
Guided local search
Greedy local search
title_short Generación automática de resúmenes extractivos de múltiples documentos basada en algoritmos meméticos
title_full Generación automática de resúmenes extractivos de múltiples documentos basada en algoritmos meméticos
title_fullStr Generación automática de resúmenes extractivos de múltiples documentos basada en algoritmos meméticos
title_full_unstemmed Generación automática de resúmenes extractivos de múltiples documentos basada en algoritmos meméticos
title_sort Generación automática de resúmenes extractivos de múltiples documentos basada en algoritmos meméticos
dc.creator.fl_str_mv Mendoza Becerra, Martha Eliana
dc.contributor.author.spa.fl_str_mv Mendoza Becerra, Martha Eliana
dc.contributor.spa.fl_str_mv León Guzmán, Elizabeth
dc.subject.ddc.spa.fl_str_mv 0 Generalidades / Computer science, information and general works
topic 0 Generalidades / Computer science, information and general works
Generación automática de resúmenes de un solo documento
Generación automática de resúmenes de múltiples documentos
Algoritmos meméticos
Búsqueda local guiada
Búsqueda local codiciosa
Extractive single-document summarization
Extractive multi-document summarization
Memetic algorithms
Guided local search
Greedy local search
dc.subject.proposal.spa.fl_str_mv Generación automática de resúmenes de un solo documento
Generación automática de resúmenes de múltiples documentos
Algoritmos meméticos
Búsqueda local guiada
Búsqueda local codiciosa
Extractive single-document summarization
Extractive multi-document summarization
Memetic algorithms
Guided local search
Greedy local search
description Recientemente los algoritmos basados en metaheurísticas han mostrado buenos resultados para generar resúmenes automáticos comparados con otros métodos del estado del arte, sin embargo, aunque los algoritmos meméticos han contribuido en la resolución de diversos problemas de optimización combinatoria con excelentes resultados, no han sido usados para resolver el problema de generación automática de resúmenes. Esta tesis doctoral está enmarcada en el área de investigación de generación automática de resúmenes de textos, y propone dos algoritmos meméticos para generar automáticamente resúmenes extractivos, uno para un solo documento y otro para múltiples documentos. Los algoritmos meméticos propuestos se componen de: una función objetivo que busca que el resumen contenga las principales temáticas de los documentos, esquemas de evolución a nivel de población (selección, cruce, mutación y reemplazo de los agentes) buscando mantener un balance entre calidad y diversidad de los agentes, y un algoritmo de búsqueda local que permite la explotación de la vecindad de las soluciones generadas incluyendo conocimiento del problema. La experimentación de los algoritmos se realiza sobre conjuntos de datos estándar, midiendo la calidad del resumen generado (comparándolo con resúmenes de referencia) por medio de medidas aceptadas por la comunidad científica. En la experimentación los algoritmos propuestos se comparan con otros métodos del estado del arte, logrando que el algoritmo para un documento ocupe el primer puesto y que el algoritmo para múltiples documentos se ubique de segundo.
publishDate 2015
dc.date.issued.spa.fl_str_mv 2015-11-13
dc.date.accessioned.spa.fl_str_mv 2019-07-02T11:39:00Z
dc.date.available.spa.fl_str_mv 2019-07-02T11:39:00Z
dc.type.spa.fl_str_mv Trabajo de grado - Doctorado
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/doctoralThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_db06
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TD
format http://purl.org/coar/resource_type/c_db06
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/56120
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/51728/
url https://repositorio.unal.edu.co/handle/unal/56120
http://bdigital.unal.edu.co/51728/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial Ingeniería de Sistemas
Ingeniería de Sistemas
dc.relation.references.spa.fl_str_mv Mendoza Becerra, Martha Eliana (2015) Generación automática de resúmenes extractivos de múltiples documentos basada en algoritmos meméticos. Doctorado thesis, Universidad Nacional de Colombia - Sede.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_16ec
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/restrictedAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_16ec
eu_rights_str_mv restrictedAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/56120/1/63483237.2015.pdf
https://repositorio.unal.edu.co/bitstream/unal/56120/2/63483237.2015.pdf.jpg
bitstream.checksum.fl_str_mv 4a3b1f49cb711fe8d42f79d74578b89d
d7a34a35b5de184be43017cafebfa0e4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089548672532480
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/restrictedAccesshttp://purl.org/coar/access_right/c_16ecLeón Guzmán, ElizabethMendoza Becerra, Martha Eliana13888416-9423-470a-97f9-65e2c5028f123002019-07-02T11:39:00Z2019-07-02T11:39:00Z2015-11-13https://repositorio.unal.edu.co/handle/unal/56120http://bdigital.unal.edu.co/51728/Recientemente los algoritmos basados en metaheurísticas han mostrado buenos resultados para generar resúmenes automáticos comparados con otros métodos del estado del arte, sin embargo, aunque los algoritmos meméticos han contribuido en la resolución de diversos problemas de optimización combinatoria con excelentes resultados, no han sido usados para resolver el problema de generación automática de resúmenes. Esta tesis doctoral está enmarcada en el área de investigación de generación automática de resúmenes de textos, y propone dos algoritmos meméticos para generar automáticamente resúmenes extractivos, uno para un solo documento y otro para múltiples documentos. Los algoritmos meméticos propuestos se componen de: una función objetivo que busca que el resumen contenga las principales temáticas de los documentos, esquemas de evolución a nivel de población (selección, cruce, mutación y reemplazo de los agentes) buscando mantener un balance entre calidad y diversidad de los agentes, y un algoritmo de búsqueda local que permite la explotación de la vecindad de las soluciones generadas incluyendo conocimiento del problema. La experimentación de los algoritmos se realiza sobre conjuntos de datos estándar, midiendo la calidad del resumen generado (comparándolo con resúmenes de referencia) por medio de medidas aceptadas por la comunidad científica. En la experimentación los algoritmos propuestos se comparan con otros métodos del estado del arte, logrando que el algoritmo para un documento ocupe el primer puesto y que el algoritmo para múltiples documentos se ubique de segundo.Abstract. Recently, algorithms based on metaheuristics have shown good results for generating automatic summaries compared with other methods in published studies, however, although the Memetic algorithms have contributed to solving a number of diverse, combinatorial optimization problems, with excellent results. They have not been used for solving the problem of automatic text summarization. This doctoral thesis falls within the research area of automatic text summarization and proposes two memetic algorithms for automatically generating extractive summaries - one for a single document and another for multiple documents. The memetic algorithms proposed consist of an objective function to ensure that the summary contains the main themes of the documents, an evolution scheme at the population level (selection, crossover, mutation and replacement of agents), seeking to maintain a balance between the quality and diversity of the agents, and a local search algorithm that allows the exploitation of the vicinity of the generated solutions, including knowledge of the problem. Testing of the algorithms is performed on standard data sets, measuring the quality of the summary generated (compared to reference summaries) through measures accepted by the scientific community. In the testing, the proposed algorithms are compared to other published methods, with the algorithm for a single document achieving first place and the algorithm for multiple documents being placed second.Doctoradoapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial Ingeniería de SistemasIngeniería de SistemasMendoza Becerra, Martha Eliana (2015) Generación automática de resúmenes extractivos de múltiples documentos basada en algoritmos meméticos. Doctorado thesis, Universidad Nacional de Colombia - Sede.0 Generalidades / Computer science, information and general worksGeneración automática de resúmenes de un solo documentoGeneración automática de resúmenes de múltiples documentosAlgoritmos meméticosBúsqueda local guiadaBúsqueda local codiciosaExtractive single-document summarizationExtractive multi-document summarizationMemetic algorithmsGuided local searchGreedy local searchGeneración automática de resúmenes extractivos de múltiples documentos basada en algoritmos meméticosTrabajo de grado - Doctoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06Texthttp://purl.org/redcol/resource_type/TDORIGINAL63483237.2015.pdfapplication/pdf2728727https://repositorio.unal.edu.co/bitstream/unal/56120/1/63483237.2015.pdf4a3b1f49cb711fe8d42f79d74578b89dMD51THUMBNAIL63483237.2015.pdf.jpg63483237.2015.pdf.jpgGenerated Thumbnailimage/jpeg4647https://repositorio.unal.edu.co/bitstream/unal/56120/2/63483237.2015.pdf.jpgd7a34a35b5de184be43017cafebfa0e4MD52unal/56120oai:repositorio.unal.edu.co:unal/561202023-03-15 23:09:39.018Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co