Text summarization techniques applied to source code summary generation and evaluation

Abstract. This dissertation explores the use of text summarization technology for generating automatic descriptions of source code artifacts. Firstly, the thesis reports the results of empirical studies aimed at investigating how developers summarize code artifacts when understanding them. These res...

Full description

Autores:
Aponte Melo, Jairo Hernán
Tipo de recurso:
Doctoral thesis
Fecha de publicación:
2012
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/20179
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/20179
http://bdigital.unal.edu.co/10626/
Palabra clave:
0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Software maintenance
Source code summarization
Program comprehension
Automatic software documentation
Empirical research
Mantenimiento de software
Resumen de código fuente
Comprensión de programas
Documentación automática de software
Investigación empírica
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_8eb4ac2ac89baac47ff425c8e8d1a409
oai_identifier_str oai:repositorio.unal.edu.co:unal/20179
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Text summarization techniques applied to source code summary generation and evaluation
title Text summarization techniques applied to source code summary generation and evaluation
spellingShingle Text summarization techniques applied to source code summary generation and evaluation
0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Software maintenance
Source code summarization
Program comprehension
Automatic software documentation
Empirical research
Mantenimiento de software
Resumen de código fuente
Comprensión de programas
Documentación automática de software
Investigación empírica
title_short Text summarization techniques applied to source code summary generation and evaluation
title_full Text summarization techniques applied to source code summary generation and evaluation
title_fullStr Text summarization techniques applied to source code summary generation and evaluation
title_full_unstemmed Text summarization techniques applied to source code summary generation and evaluation
title_sort Text summarization techniques applied to source code summary generation and evaluation
dc.creator.fl_str_mv Aponte Melo, Jairo Hernán
dc.contributor.author.spa.fl_str_mv Aponte Melo, Jairo Hernán
dc.contributor.spa.fl_str_mv Marcus, Andrian
dc.subject.ddc.spa.fl_str_mv 0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
topic 0 Generalidades / Computer science, information and general works
62 Ingeniería y operaciones afines / Engineering
Software maintenance
Source code summarization
Program comprehension
Automatic software documentation
Empirical research
Mantenimiento de software
Resumen de código fuente
Comprensión de programas
Documentación automática de software
Investigación empírica
dc.subject.proposal.spa.fl_str_mv Software maintenance
Source code summarization
Program comprehension
Automatic software documentation
Empirical research
Mantenimiento de software
Resumen de código fuente
Comprensión de programas
Documentación automática de software
Investigación empírica
description Abstract. This dissertation explores the use of text summarization technology for generating automatic descriptions of source code artifacts. Firstly, the thesis reports the results of empirical studies aimed at investigating how developers summarize code artifacts when understanding them. These results are useful in explaining how developers abstract source code, in gaining insights about the comprehension process, in explaining the role of code elements in such a process, and for the development of automatic source code summarization tools. Secondly, the dissertation describes several approaches for creating short and accurate textual descriptions for various types of code entities. The results of the evaluations indicate that text summarization techniques are suitable for automatic source code summarization since developers generally agree with the summaries produced by the proposed methods. Thus, these summaries can be useful for improving software comprehension processes, which usually occur during software maintenance tasks.
publishDate 2012
dc.date.issued.spa.fl_str_mv 2012
dc.date.accessioned.spa.fl_str_mv 2019-06-25T18:25:01Z
dc.date.available.spa.fl_str_mv 2019-06-25T18:25:01Z
dc.type.spa.fl_str_mv Trabajo de grado - Doctorado
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/doctoralThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_db06
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TD
format http://purl.org/coar/resource_type/c_db06
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/20179
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/10626/
url https://repositorio.unal.edu.co/handle/unal/20179
http://bdigital.unal.edu.co/10626/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial Ingeniería de Sistemas
Ingeniería de Sistemas
dc.relation.references.spa.fl_str_mv Aponte Melo, Jairo Hernán (2012) Text summarization techniques applied to source code summary generation and evaluation. Doctorado thesis, Universidad Nacional de Colombia.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/20179/1/299766.2012.pdf
https://repositorio.unal.edu.co/bitstream/unal/20179/2/299766.2012.pdf.jpg
bitstream.checksum.fl_str_mv 1237ee394988f52727ee86c0e49052d2
791dd7b3c332a031e02d49fdd20bdcde
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089229079150592
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Marcus, AndrianAponte Melo, Jairo Hernán3869739b-ea9b-4110-a2c9-3f7dfe3d1bc53002019-06-25T18:25:01Z2019-06-25T18:25:01Z2012https://repositorio.unal.edu.co/handle/unal/20179http://bdigital.unal.edu.co/10626/Abstract. This dissertation explores the use of text summarization technology for generating automatic descriptions of source code artifacts. Firstly, the thesis reports the results of empirical studies aimed at investigating how developers summarize code artifacts when understanding them. These results are useful in explaining how developers abstract source code, in gaining insights about the comprehension process, in explaining the role of code elements in such a process, and for the development of automatic source code summarization tools. Secondly, the dissertation describes several approaches for creating short and accurate textual descriptions for various types of code entities. The results of the evaluations indicate that text summarization techniques are suitable for automatic source code summarization since developers generally agree with the summaries produced by the proposed methods. Thus, these summaries can be useful for improving software comprehension processes, which usually occur during software maintenance tasks.Esta tesis explora el uso de tecnologías de resumen de textos para la generación automática de descripciones de artefactos de código fuente. En primer lugar, la tesis reporta los resultados de estudios empíricos que tuvieron como propósito investigar cómo los programadores resumen artefactos de código, durante el proceso de compresión de los mismos. Estos resultados son útiles para explicar cómo los programadores sintetizan trozos de código fuente, para obtener conocimiento acerca del proceso de comprensión, para explicar el rol de las partes del artefacto en ese proceso, y para el desarrollo de herramientas de resumen automático de código fuente. En segundo lugar, este trabajo de tesis describe varios métodos para la creación automática de descripciones textuales, cortas y precisas, para varios tipos de artefactos de código. Los resultados de las evaluaciones indican que las técnicas de resumen de texto son adecuadas para el resumen automático de código fuente, teniendo en cuenta que los desarrolladores generalmente están de acuerdo con los resúmenes producidos mediante los métodos descritos. En consecuencia, estos resúmenes pueden ser útiles para mejorar los procesos de comprensión de software que usualmente ocurren cuando se realizan tareas de mantenimiento de software.Doctoradoapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial Ingeniería de SistemasIngeniería de SistemasAponte Melo, Jairo Hernán (2012) Text summarization techniques applied to source code summary generation and evaluation. Doctorado thesis, Universidad Nacional de Colombia.0 Generalidades / Computer science, information and general works62 Ingeniería y operaciones afines / EngineeringSoftware maintenanceSource code summarizationProgram comprehensionAutomatic software documentationEmpirical researchMantenimiento de softwareResumen de código fuenteComprensión de programasDocumentación automática de softwareInvestigación empíricaText summarization techniques applied to source code summary generation and evaluationTrabajo de grado - Doctoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06Texthttp://purl.org/redcol/resource_type/TDORIGINAL299766.2012.pdfapplication/pdf1568515https://repositorio.unal.edu.co/bitstream/unal/20179/1/299766.2012.pdf1237ee394988f52727ee86c0e49052d2MD51THUMBNAIL299766.2012.pdf.jpg299766.2012.pdf.jpgGenerated Thumbnailimage/jpeg4154https://repositorio.unal.edu.co/bitstream/unal/20179/2/299766.2012.pdf.jpg791dd7b3c332a031e02d49fdd20bdcdeMD52unal/20179oai:repositorio.unal.edu.co:unal/201792023-09-25 23:05:31.493Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co