Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático

La definición de los requisitos del lenguaje natural es un proceso que puede llevar mucho tiempo en grandes proyectos de software. Clasificar los requisitos de software de lenguaje natural en funcionales y no funcionales, y al mismo tiempo categorías de no funcionales como rendimiento, compatibilida...

Full description

Autores:
Abadía Sarria, Sara
Tipo de recurso:
Masters Thesis
Fecha de publicación:
2022
Institución:
Pontificia Universidad Javeriana Cali
Repositorio:
Vitela
Idioma:
spa
OAI Identifier:
oai:vitela.javerianacali.edu.co:11522/2019
Acceso en línea:
https://vitela.javerianacali.edu.co/handle/11522/2019
Palabra clave:
Aprendizaje automático
Clasificación de requisitos
Repositorio de requisitos de software en español
Rights
License
https://creativecommons.org/licenses/by-nc-sa/4.0/
id Vitela2_1fe337307e57a7e5ffe727deb93de8e2
oai_identifier_str oai:vitela.javerianacali.edu.co:11522/2019
network_acronym_str Vitela2
network_name_str Vitela
repository_id_str
dc.title.spa.fl_str_mv Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático
title Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático
spellingShingle Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático
Aprendizaje automático
Clasificación de requisitos
Repositorio de requisitos de software en español
title_short Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático
title_full Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático
title_fullStr Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático
title_full_unstemmed Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático
title_sort Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático
dc.creator.fl_str_mv Abadía Sarria, Sara
dc.contributor.advisor.none.fl_str_mv Pabón, María Constanza
Martínez Arias, Juan Carlos
dc.contributor.author.none.fl_str_mv Abadía Sarria, Sara
dc.subject.none.fl_str_mv Aprendizaje automático
Clasificación de requisitos
Repositorio de requisitos de software en español
topic Aprendizaje automático
Clasificación de requisitos
Repositorio de requisitos de software en español
description La definición de los requisitos del lenguaje natural es un proceso que puede llevar mucho tiempo en grandes proyectos de software. Clasificar los requisitos de software de lenguaje natural en funcionales y no funcionales, y al mismo tiempo categorías de no funcionales como rendimiento, compatibilidad, usabilidad, confiabilidad, seguridad, mantenibilidad y portabilidad, es una tarea que contribuye a la definición de requisitos para que proyectos de software sean exitosos. Esta tarea de clasificación requiere el juicio de un experto y requiere mucho tiempo, siendo un desafío porque es un proceso manual. La automatización de la clasificación de requisitos es una estrategia para agilizar las actividades de los ingenieros de requisitos. Estudios relacionados muestran la existencia de escasos conjuntos de datos de requisitos de software, lo que dificulta promover, crear y mejorar modelos predictivos que faciliten las tareas de clasificación automática de requisitos, además, estos escasos conjuntos de datos en la mayoría de ellos están definidos en inglés, por lo tanto, los modelos predictivos desarrollados no se pueden utilizar directamente para proyectos en diferentes idiomas porque la gramática varía con el idioma. En vista de lo anterior, este trabajo se enfoca en generar modelos predictivos de clasificación de requisitos de software de lenguaje natural en funcionales y no funcionales, y al mismo tiempo las categorías de no funcionales de acuerdo con el estándar ISO/IEC 25010, para contribuir al desarrollo de estudios que apliquen técnicas de aprendizaje automático en el contexto de la ingeniería de requisitos para proyectos desarrollados en español. Los resultados muestran un indicador F1 superior al 60% para la mayoría de los experimentos en donde se utilizó el aumento artificial de información. El estudio se realizó con una muestra de más de 2800 requisitos de software descritos en español que previamente fueron traducidos y consolidados a partir de varios conjuntos de datos en inglés ampliamente utilizados en otras investigaciones, de los cuales 1887 requisitos fueron etiquetados manualmente. La traducción al español se realizó a través de la herramienta de traducción automática de Google y posteriormente, la traducción se verificó manualmente. Este conjunto de datos en español estará disponible para la comunidad científica.
publishDate 2022
dc.date.issued.none.fl_str_mv 2022
dc.date.accessioned.none.fl_str_mv 2024-06-08T01:05:48Z
dc.date.available.none.fl_str_mv 2024-06-08T01:05:48Z
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_bdcc
dc.type.local.none.fl_str_mv Tesis/Trabajo de grado - Monografía - Maestría
dc.type.redcol.none.fl_str_mv https://purl.org/redcol/resource_type/TM
format http://purl.org/coar/resource_type/c_bdcc
dc.identifier.uri.none.fl_str_mv https://vitela.javerianacali.edu.co/handle/11522/2019
url https://vitela.javerianacali.edu.co/handle/11522/2019
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.creativecommons.none.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
https://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
dc.format.extent.none.fl_str_mv 70 p.
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontificia Universidad Javeriana Cali
publisher.none.fl_str_mv Pontificia Universidad Javeriana Cali
institution Pontificia Universidad Javeriana Cali
bitstream.url.fl_str_mv https://vitela.javerianacali.edu.co/bitstreams/78bdff34-f264-465e-bacb-8dae4d7c0868/download
https://vitela.javerianacali.edu.co/bitstreams/55920538-4ddb-4f07-b68f-95d7eeacd1e5/download
https://vitela.javerianacali.edu.co/bitstreams/79f6cf2d-0c93-4866-95c6-a19e8bbd4292/download
https://vitela.javerianacali.edu.co/bitstreams/a0f12cee-8faa-4628-9a0b-fb02f9598c74/download
https://vitela.javerianacali.edu.co/bitstreams/1900c587-b6f7-4888-b493-b509c6d332bb/download
https://vitela.javerianacali.edu.co/bitstreams/d786ff10-4673-4e32-8673-44c2d6d71d17/download
https://vitela.javerianacali.edu.co/bitstreams/922bdae5-9e0e-4af5-8f58-e636188f661e/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
61373b1ee54da7810497794e8b749352
f795a2b1a102eb688805e514f4565b59
bd94200028ccc07488eb326a27cdb896
bb363cb157f75a16394485ff374f65d3
3f861c184a63623eaf55a5bead7235c9
79bf67a2778ab4bc47ba19e645c3fae4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Vitela
repository.mail.fl_str_mv vitela.mail@javerianacali.edu.co
_version_ 1812095067024785408
spelling Pabón, María ConstanzaMartínez Arias, Juan CarlosAbadía Sarria, Sara2024-06-08T01:05:48Z2024-06-08T01:05:48Z2022https://vitela.javerianacali.edu.co/handle/11522/2019La definición de los requisitos del lenguaje natural es un proceso que puede llevar mucho tiempo en grandes proyectos de software. Clasificar los requisitos de software de lenguaje natural en funcionales y no funcionales, y al mismo tiempo categorías de no funcionales como rendimiento, compatibilidad, usabilidad, confiabilidad, seguridad, mantenibilidad y portabilidad, es una tarea que contribuye a la definición de requisitos para que proyectos de software sean exitosos. Esta tarea de clasificación requiere el juicio de un experto y requiere mucho tiempo, siendo un desafío porque es un proceso manual. La automatización de la clasificación de requisitos es una estrategia para agilizar las actividades de los ingenieros de requisitos. Estudios relacionados muestran la existencia de escasos conjuntos de datos de requisitos de software, lo que dificulta promover, crear y mejorar modelos predictivos que faciliten las tareas de clasificación automática de requisitos, además, estos escasos conjuntos de datos en la mayoría de ellos están definidos en inglés, por lo tanto, los modelos predictivos desarrollados no se pueden utilizar directamente para proyectos en diferentes idiomas porque la gramática varía con el idioma. En vista de lo anterior, este trabajo se enfoca en generar modelos predictivos de clasificación de requisitos de software de lenguaje natural en funcionales y no funcionales, y al mismo tiempo las categorías de no funcionales de acuerdo con el estándar ISO/IEC 25010, para contribuir al desarrollo de estudios que apliquen técnicas de aprendizaje automático en el contexto de la ingeniería de requisitos para proyectos desarrollados en español. Los resultados muestran un indicador F1 superior al 60% para la mayoría de los experimentos en donde se utilizó el aumento artificial de información. El estudio se realizó con una muestra de más de 2800 requisitos de software descritos en español que previamente fueron traducidos y consolidados a partir de varios conjuntos de datos en inglés ampliamente utilizados en otras investigaciones, de los cuales 1887 requisitos fueron etiquetados manualmente. La traducción al español se realizó a través de la herramienta de traducción automática de Google y posteriormente, la traducción se verificó manualmente. Este conjunto de datos en español estará disponible para la comunidad científica.The definition of natural language requirements is a process that can be time-consuming in large software projects. Classifying natural language software requirements into functional and non-functional classes, and at the same time non-functional sub-classes such as performance, compatibility, usability, reliability, security, maintainability, and portability, is a task that contributes to the requirements definition for successful software projects. This classification task requires expert judgment and is time-consuming, being challenging because it is a manual process. Automating requirements classification is a strategy to streamline the activities of requirements engineers. Related studies show the existence of scarce software requirements data sets, which makes it difficult to promote, create and improve predictive models that facilitate the tasks of automatic requirements classification, in addition, these scarce data sets in most of them are defined in English, therefore, the predictive models developed cannot be used directly for projects in different languages because the grammar varies with the language. In view of the above, this work focuses on generating predictive models of natural language software requirements classification into functional and non-functional classes, and at the same time non-functional sub-classes according to the ISO / IEC 25010 standard, to contribute to the development of studies that apply machine learning techniques in the requirements engineering context for projects developed in Spanish. The results shown an F1-Score above 60% for all the five experiments where oversampling was used. The study was conducted with a sample of more than 2,800 software requirements described in Spanish that were previously translated and consolidated from multiple data sets in English widely used in other research, of which 1,887 requirements were manually tagged. The translation into Spanish was done through Google's automatic translation tool and subsequently, the translation was verified manually. This data set in Spanish will be available to the scientific community.70 p.application/pdfspaPontificia Universidad Javeriana Calihttps://creativecommons.org/licenses/by-nc-sa/4.0/https://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_abf2Aprendizaje automáticoClasificación de requisitosRepositorio de requisitos de software en españolModelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automáticohttp://purl.org/coar/resource_type/c_bdccTesis/Trabajo de grado - Monografía - Maestríahttps://purl.org/redcol/resource_type/TMFacultad de Ingeniería y Ciencias. Maestría en IngenieríaPontificia Universidad Javeriana CaliMaestríaLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://vitela.javerianacali.edu.co/bitstreams/78bdff34-f264-465e-bacb-8dae4d7c0868/download8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINAL3. Trabajo_Grado_Sara_Abadia_Sarria.pdf3. Trabajo_Grado_Sara_Abadia_Sarria.pdfapplication/pdf1309906https://vitela.javerianacali.edu.co/bitstreams/55920538-4ddb-4f07-b68f-95d7eeacd1e5/download61373b1ee54da7810497794e8b749352MD521.LICENCIA DE USO - TG.pdf1.LICENCIA DE USO - TG.pdfapplication/pdf200625https://vitela.javerianacali.edu.co/bitstreams/79f6cf2d-0c93-4866-95c6-a19e8bbd4292/downloadf795a2b1a102eb688805e514f4565b59MD53TEXT3. Trabajo_Grado_Sara_Abadia_Sarria.pdf.txt3. Trabajo_Grado_Sara_Abadia_Sarria.pdf.txtExtracted texttext/plain102022https://vitela.javerianacali.edu.co/bitstreams/a0f12cee-8faa-4628-9a0b-fb02f9598c74/downloadbd94200028ccc07488eb326a27cdb896MD5121.LICENCIA DE USO - TG.pdf.txt1.LICENCIA DE USO - TG.pdf.txtExtracted texttext/plain4926https://vitela.javerianacali.edu.co/bitstreams/1900c587-b6f7-4888-b493-b509c6d332bb/downloadbb363cb157f75a16394485ff374f65d3MD514THUMBNAIL3. Trabajo_Grado_Sara_Abadia_Sarria.pdf.jpg3. Trabajo_Grado_Sara_Abadia_Sarria.pdf.jpgGenerated Thumbnailimage/jpeg3352https://vitela.javerianacali.edu.co/bitstreams/d786ff10-4673-4e32-8673-44c2d6d71d17/download3f861c184a63623eaf55a5bead7235c9MD5131.LICENCIA DE USO - TG.pdf.jpg1.LICENCIA DE USO - TG.pdf.jpgGenerated Thumbnailimage/jpeg5228https://vitela.javerianacali.edu.co/bitstreams/922bdae5-9e0e-4af5-8f58-e636188f661e/download79bf67a2778ab4bc47ba19e645c3fae4MD51511522/2019oai:vitela.javerianacali.edu.co:11522/20192024-06-25 05:13:44.149https://creativecommons.org/licenses/by-nc-sa/4.0/open.accesshttps://vitela.javerianacali.edu.coRepositorio Vitelavitela.mail@javerianacali.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=