Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático
La definición de los requisitos del lenguaje natural es un proceso que puede llevar mucho tiempo en grandes proyectos de software. Clasificar los requisitos de software de lenguaje natural en funcionales y no funcionales, y al mismo tiempo categorías de no funcionales como rendimiento, compatibilida...
- Autores:
-
Abadía Sarria, Sara
- Tipo de recurso:
- Masters Thesis
- Fecha de publicación:
- 2022
- Institución:
- Pontificia Universidad Javeriana Cali
- Repositorio:
- Vitela
- Idioma:
- spa
- OAI Identifier:
- oai:vitela.javerianacali.edu.co:11522/2019
- Acceso en línea:
- https://vitela.javerianacali.edu.co/handle/11522/2019
- Palabra clave:
- Aprendizaje automático
Clasificación de requisitos
Repositorio de requisitos de software en español
- Rights
- License
- https://creativecommons.org/licenses/by-nc-sa/4.0/
id |
Vitela2_1fe337307e57a7e5ffe727deb93de8e2 |
---|---|
oai_identifier_str |
oai:vitela.javerianacali.edu.co:11522/2019 |
network_acronym_str |
Vitela2 |
network_name_str |
Vitela |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático |
title |
Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático |
spellingShingle |
Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático Aprendizaje automático Clasificación de requisitos Repositorio de requisitos de software en español |
title_short |
Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático |
title_full |
Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático |
title_fullStr |
Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático |
title_full_unstemmed |
Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático |
title_sort |
Modelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automático |
dc.creator.fl_str_mv |
Abadía Sarria, Sara |
dc.contributor.advisor.none.fl_str_mv |
Pabón, María Constanza Martínez Arias, Juan Carlos |
dc.contributor.author.none.fl_str_mv |
Abadía Sarria, Sara |
dc.subject.none.fl_str_mv |
Aprendizaje automático Clasificación de requisitos Repositorio de requisitos de software en español |
topic |
Aprendizaje automático Clasificación de requisitos Repositorio de requisitos de software en español |
description |
La definición de los requisitos del lenguaje natural es un proceso que puede llevar mucho tiempo en grandes proyectos de software. Clasificar los requisitos de software de lenguaje natural en funcionales y no funcionales, y al mismo tiempo categorías de no funcionales como rendimiento, compatibilidad, usabilidad, confiabilidad, seguridad, mantenibilidad y portabilidad, es una tarea que contribuye a la definición de requisitos para que proyectos de software sean exitosos. Esta tarea de clasificación requiere el juicio de un experto y requiere mucho tiempo, siendo un desafío porque es un proceso manual. La automatización de la clasificación de requisitos es una estrategia para agilizar las actividades de los ingenieros de requisitos. Estudios relacionados muestran la existencia de escasos conjuntos de datos de requisitos de software, lo que dificulta promover, crear y mejorar modelos predictivos que faciliten las tareas de clasificación automática de requisitos, además, estos escasos conjuntos de datos en la mayoría de ellos están definidos en inglés, por lo tanto, los modelos predictivos desarrollados no se pueden utilizar directamente para proyectos en diferentes idiomas porque la gramática varía con el idioma. En vista de lo anterior, este trabajo se enfoca en generar modelos predictivos de clasificación de requisitos de software de lenguaje natural en funcionales y no funcionales, y al mismo tiempo las categorías de no funcionales de acuerdo con el estándar ISO/IEC 25010, para contribuir al desarrollo de estudios que apliquen técnicas de aprendizaje automático en el contexto de la ingeniería de requisitos para proyectos desarrollados en español. Los resultados muestran un indicador F1 superior al 60% para la mayoría de los experimentos en donde se utilizó el aumento artificial de información. El estudio se realizó con una muestra de más de 2800 requisitos de software descritos en español que previamente fueron traducidos y consolidados a partir de varios conjuntos de datos en inglés ampliamente utilizados en otras investigaciones, de los cuales 1887 requisitos fueron etiquetados manualmente. La traducción al español se realizó a través de la herramienta de traducción automática de Google y posteriormente, la traducción se verificó manualmente. Este conjunto de datos en español estará disponible para la comunidad científica. |
publishDate |
2022 |
dc.date.issued.none.fl_str_mv |
2022 |
dc.date.accessioned.none.fl_str_mv |
2024-06-08T01:05:48Z |
dc.date.available.none.fl_str_mv |
2024-06-08T01:05:48Z |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_bdcc |
dc.type.local.none.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Maestría |
dc.type.redcol.none.fl_str_mv |
https://purl.org/redcol/resource_type/TM |
format |
http://purl.org/coar/resource_type/c_bdcc |
dc.identifier.uri.none.fl_str_mv |
https://vitela.javerianacali.edu.co/handle/11522/2019 |
url |
https://vitela.javerianacali.edu.co/handle/11522/2019 |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
dc.rights.creativecommons.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ https://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
dc.format.extent.none.fl_str_mv |
70 p. |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontificia Universidad Javeriana Cali |
publisher.none.fl_str_mv |
Pontificia Universidad Javeriana Cali |
institution |
Pontificia Universidad Javeriana Cali |
bitstream.url.fl_str_mv |
https://vitela.javerianacali.edu.co/bitstreams/78bdff34-f264-465e-bacb-8dae4d7c0868/download https://vitela.javerianacali.edu.co/bitstreams/55920538-4ddb-4f07-b68f-95d7eeacd1e5/download https://vitela.javerianacali.edu.co/bitstreams/79f6cf2d-0c93-4866-95c6-a19e8bbd4292/download https://vitela.javerianacali.edu.co/bitstreams/a0f12cee-8faa-4628-9a0b-fb02f9598c74/download https://vitela.javerianacali.edu.co/bitstreams/1900c587-b6f7-4888-b493-b509c6d332bb/download https://vitela.javerianacali.edu.co/bitstreams/d786ff10-4673-4e32-8673-44c2d6d71d17/download https://vitela.javerianacali.edu.co/bitstreams/922bdae5-9e0e-4af5-8f58-e636188f661e/download |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 61373b1ee54da7810497794e8b749352 f795a2b1a102eb688805e514f4565b59 bd94200028ccc07488eb326a27cdb896 bb363cb157f75a16394485ff374f65d3 3f861c184a63623eaf55a5bead7235c9 79bf67a2778ab4bc47ba19e645c3fae4 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Vitela |
repository.mail.fl_str_mv |
vitela.mail@javerianacali.edu.co |
_version_ |
1812095067024785408 |
spelling |
Pabón, María ConstanzaMartínez Arias, Juan CarlosAbadía Sarria, Sara2024-06-08T01:05:48Z2024-06-08T01:05:48Z2022https://vitela.javerianacali.edu.co/handle/11522/2019La definición de los requisitos del lenguaje natural es un proceso que puede llevar mucho tiempo en grandes proyectos de software. Clasificar los requisitos de software de lenguaje natural en funcionales y no funcionales, y al mismo tiempo categorías de no funcionales como rendimiento, compatibilidad, usabilidad, confiabilidad, seguridad, mantenibilidad y portabilidad, es una tarea que contribuye a la definición de requisitos para que proyectos de software sean exitosos. Esta tarea de clasificación requiere el juicio de un experto y requiere mucho tiempo, siendo un desafío porque es un proceso manual. La automatización de la clasificación de requisitos es una estrategia para agilizar las actividades de los ingenieros de requisitos. Estudios relacionados muestran la existencia de escasos conjuntos de datos de requisitos de software, lo que dificulta promover, crear y mejorar modelos predictivos que faciliten las tareas de clasificación automática de requisitos, además, estos escasos conjuntos de datos en la mayoría de ellos están definidos en inglés, por lo tanto, los modelos predictivos desarrollados no se pueden utilizar directamente para proyectos en diferentes idiomas porque la gramática varía con el idioma. En vista de lo anterior, este trabajo se enfoca en generar modelos predictivos de clasificación de requisitos de software de lenguaje natural en funcionales y no funcionales, y al mismo tiempo las categorías de no funcionales de acuerdo con el estándar ISO/IEC 25010, para contribuir al desarrollo de estudios que apliquen técnicas de aprendizaje automático en el contexto de la ingeniería de requisitos para proyectos desarrollados en español. Los resultados muestran un indicador F1 superior al 60% para la mayoría de los experimentos en donde se utilizó el aumento artificial de información. El estudio se realizó con una muestra de más de 2800 requisitos de software descritos en español que previamente fueron traducidos y consolidados a partir de varios conjuntos de datos en inglés ampliamente utilizados en otras investigaciones, de los cuales 1887 requisitos fueron etiquetados manualmente. La traducción al español se realizó a través de la herramienta de traducción automática de Google y posteriormente, la traducción se verificó manualmente. Este conjunto de datos en español estará disponible para la comunidad científica.The definition of natural language requirements is a process that can be time-consuming in large software projects. Classifying natural language software requirements into functional and non-functional classes, and at the same time non-functional sub-classes such as performance, compatibility, usability, reliability, security, maintainability, and portability, is a task that contributes to the requirements definition for successful software projects. This classification task requires expert judgment and is time-consuming, being challenging because it is a manual process. Automating requirements classification is a strategy to streamline the activities of requirements engineers. Related studies show the existence of scarce software requirements data sets, which makes it difficult to promote, create and improve predictive models that facilitate the tasks of automatic requirements classification, in addition, these scarce data sets in most of them are defined in English, therefore, the predictive models developed cannot be used directly for projects in different languages because the grammar varies with the language. In view of the above, this work focuses on generating predictive models of natural language software requirements classification into functional and non-functional classes, and at the same time non-functional sub-classes according to the ISO / IEC 25010 standard, to contribute to the development of studies that apply machine learning techniques in the requirements engineering context for projects developed in Spanish. The results shown an F1-Score above 60% for all the five experiments where oversampling was used. The study was conducted with a sample of more than 2,800 software requirements described in Spanish that were previously translated and consolidated from multiple data sets in English widely used in other research, of which 1,887 requirements were manually tagged. The translation into Spanish was done through Google's automatic translation tool and subsequently, the translation was verified manually. This data set in Spanish will be available to the scientific community.70 p.application/pdfspaPontificia Universidad Javeriana Calihttps://creativecommons.org/licenses/by-nc-sa/4.0/https://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_abf2Aprendizaje automáticoClasificación de requisitosRepositorio de requisitos de software en españolModelo de clasificación de requisitos de software mediante la aplicación de técnicas de aprendizaje automáticohttp://purl.org/coar/resource_type/c_bdccTesis/Trabajo de grado - Monografía - Maestríahttps://purl.org/redcol/resource_type/TMFacultad de Ingeniería y Ciencias. Maestría en IngenieríaPontificia Universidad Javeriana CaliMaestríaLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://vitela.javerianacali.edu.co/bitstreams/78bdff34-f264-465e-bacb-8dae4d7c0868/download8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINAL3. Trabajo_Grado_Sara_Abadia_Sarria.pdf3. Trabajo_Grado_Sara_Abadia_Sarria.pdfapplication/pdf1309906https://vitela.javerianacali.edu.co/bitstreams/55920538-4ddb-4f07-b68f-95d7eeacd1e5/download61373b1ee54da7810497794e8b749352MD521.LICENCIA DE USO - TG.pdf1.LICENCIA DE USO - TG.pdfapplication/pdf200625https://vitela.javerianacali.edu.co/bitstreams/79f6cf2d-0c93-4866-95c6-a19e8bbd4292/downloadf795a2b1a102eb688805e514f4565b59MD53TEXT3. Trabajo_Grado_Sara_Abadia_Sarria.pdf.txt3. Trabajo_Grado_Sara_Abadia_Sarria.pdf.txtExtracted texttext/plain102022https://vitela.javerianacali.edu.co/bitstreams/a0f12cee-8faa-4628-9a0b-fb02f9598c74/downloadbd94200028ccc07488eb326a27cdb896MD5121.LICENCIA DE USO - TG.pdf.txt1.LICENCIA DE USO - TG.pdf.txtExtracted texttext/plain4926https://vitela.javerianacali.edu.co/bitstreams/1900c587-b6f7-4888-b493-b509c6d332bb/downloadbb363cb157f75a16394485ff374f65d3MD514THUMBNAIL3. Trabajo_Grado_Sara_Abadia_Sarria.pdf.jpg3. Trabajo_Grado_Sara_Abadia_Sarria.pdf.jpgGenerated Thumbnailimage/jpeg3352https://vitela.javerianacali.edu.co/bitstreams/d786ff10-4673-4e32-8673-44c2d6d71d17/download3f861c184a63623eaf55a5bead7235c9MD5131.LICENCIA DE USO - TG.pdf.jpg1.LICENCIA DE USO - TG.pdf.jpgGenerated Thumbnailimage/jpeg5228https://vitela.javerianacali.edu.co/bitstreams/922bdae5-9e0e-4af5-8f58-e636188f661e/download79bf67a2778ab4bc47ba19e645c3fae4MD51511522/2019oai:vitela.javerianacali.edu.co:11522/20192024-06-25 05:13:44.149https://creativecommons.org/licenses/by-nc-sa/4.0/open.accesshttps://vitela.javerianacali.edu.coRepositorio Vitelavitela.mail@javerianacali.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |