Machine Learning Best Practices Discussed on Stack Exchange

A lo largo de este documento se presenta un análisis de las mejores/buenas prácticas de Machine Learning (ML) que se analizan en los sitios web de comunidades de preguntas y respuestas (CQA, por sus siglas en inglés) para establecer si estas prácticas se están utilizando en Ingeniería de software (S...

Full description

Autores:
Martínez Solano, Germán David
Bayona Latorre, Mónica Andrea
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/55704
Acceso en línea:
http://hdl.handle.net/1992/55704
Palabra clave:
Ingeniería de software
Buenas prácticas
Machine learning
Diseño de páginas web
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
id UNIANDES2_e72f91409e99c68d13af155e51015c37
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/55704
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.eng.fl_str_mv Machine Learning Best Practices Discussed on Stack Exchange
title Machine Learning Best Practices Discussed on Stack Exchange
spellingShingle Machine Learning Best Practices Discussed on Stack Exchange
Ingeniería de software
Buenas prácticas
Machine learning
Diseño de páginas web
Ingeniería
title_short Machine Learning Best Practices Discussed on Stack Exchange
title_full Machine Learning Best Practices Discussed on Stack Exchange
title_fullStr Machine Learning Best Practices Discussed on Stack Exchange
title_full_unstemmed Machine Learning Best Practices Discussed on Stack Exchange
title_sort Machine Learning Best Practices Discussed on Stack Exchange
dc.creator.fl_str_mv Martínez Solano, Germán David
Bayona Latorre, Mónica Andrea
dc.contributor.advisor.none.fl_str_mv Linares Vásquez, Mario
dc.contributor.author.spa.fl_str_mv Martínez Solano, Germán David
Bayona Latorre, Mónica Andrea
dc.contributor.jury.spa.fl_str_mv Mojica Hanke, Anamaría Irmgard
dc.subject.keyword.none.fl_str_mv Ingeniería de software
Buenas prácticas
Machine learning
Diseño de páginas web
topic Ingeniería de software
Buenas prácticas
Machine learning
Diseño de páginas web
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description A lo largo de este documento se presenta un análisis de las mejores/buenas prácticas de Machine Learning (ML) que se analizan en los sitios web de comunidades de preguntas y respuestas (CQA, por sus siglas en inglés) para establecer si estas prácticas se están utilizando en Ingeniería de software (SE, por sus siglas en inglés). Para lograr esto, se siguieron una serie de pasos para extraer información de diferentes comunidades de preguntas y respuestas (Q&AC, por sus siglas en inglés) del sitio web de Stack Exchange (STE), se descargaron los registros de usuario de las páginas seleccionadas, se pre-procesaron y se obtuvo información relevante. Además, se analizó y recopiló información sobre publicaciones que ya estaban etiquetadas con posibles buenas prácticas y se elaboró una taxonomía de las mejores prácticas de ML. Como base para demostrar en la siguiente fase del proyecto si se están aplicando las buenas prácticas de la taxonomía, se realizaron 2 actividades (i) descargar, clasificar y filtrar documentos de conferencias SE que utilizan ML; (ii) enviar encuestas a los autores de artículos de SE, a fin de conocer qué buenas prácticas han aplicado. Finalmente, se presentan algunas estadísticas basadas en los registros descargados y el análisis de los artículos de las conferencias.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-02-22T20:10:56Z
dc.date.available.none.fl_str_mv 2022-02-22T20:10:56Z
dc.date.issued.none.fl_str_mv 2022
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/55704
dc.identifier.pdf.spa.fl_str_mv 26482.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/55704
identifier_str_mv 26482.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 32 páginas
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad de los Andes
dc.publisher.program.spa.fl_str_mv Ingeniería de Sistemas y Computación
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingeniería
dc.publisher.department.spa.fl_str_mv Departamento de Ingeniería de Sistemas y Computación
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/b23799a8-baf8-4fea-875d-bfd70e211226/download
https://repositorio.uniandes.edu.co/bitstreams/5cc75246-6157-45d2-b513-52133dfeba60/download
https://repositorio.uniandes.edu.co/bitstreams/131cbf84-9949-4133-a575-4046a7d268e4/download
bitstream.checksum.fl_str_mv 61407eba9996ce60f133579592f41a11
bc58ea7c830c8c221ce0735022fee1c5
e583db39a7c05dfc52989c0b4951032c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1808390297609043968
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Linares Vásquez, Mariovirtual::7585-1Martínez Solano, Germán David34deffa5-2ffc-4203-9b7d-a7d15f81c214500Bayona Latorre, Mónica Andrea0ef00b24-5a56-4a35-ba9f-38edaa2560a8500Mojica Hanke, Anamaría Irmgard2022-02-22T20:10:56Z2022-02-22T20:10:56Z2022http://hdl.handle.net/1992/5570426482.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/A lo largo de este documento se presenta un análisis de las mejores/buenas prácticas de Machine Learning (ML) que se analizan en los sitios web de comunidades de preguntas y respuestas (CQA, por sus siglas en inglés) para establecer si estas prácticas se están utilizando en Ingeniería de software (SE, por sus siglas en inglés). Para lograr esto, se siguieron una serie de pasos para extraer información de diferentes comunidades de preguntas y respuestas (Q&AC, por sus siglas en inglés) del sitio web de Stack Exchange (STE), se descargaron los registros de usuario de las páginas seleccionadas, se pre-procesaron y se obtuvo información relevante. Además, se analizó y recopiló información sobre publicaciones que ya estaban etiquetadas con posibles buenas prácticas y se elaboró una taxonomía de las mejores prácticas de ML. Como base para demostrar en la siguiente fase del proyecto si se están aplicando las buenas prácticas de la taxonomía, se realizaron 2 actividades (i) descargar, clasificar y filtrar documentos de conferencias SE que utilizan ML; (ii) enviar encuestas a los autores de artículos de SE, a fin de conocer qué buenas prácticas han aplicado. Finalmente, se presentan algunas estadísticas basadas en los registros descargados y el análisis de los artículos de las conferencias.Throughout this document, an analysis of which Machine Learning (ML) best/ good practices are discussed in Community Question Answering (CQA) websites is presented in order to establish if these practices are being used in Software Engineering (SE). To achieve this, a series of steps were followed to extract information from different Question and Answering communities (Q&ACs) from Stack Exchange (STE) website, user dumps of the selected pages were downloaded, pre-processed and relevant information was obtained. In addition, information about publications that were already tagged with possible best practices was analyzed and collected and a plausible taxonomy of ML best practices was made. As a basis to demonstrate in the next phase of the project if the good practices of the taxonomy are being applied, 2 activities were carried out (i) download, classify and filter SE conference papers that use ML; (ii) survey the authors of SE articles, to find out what good practices they have followed. Finally, some statistics based on the downloaded dump and analysis of the conference papers are presented.Ingeniero de Sistemas y ComputaciónPregrado32 páginasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y ComputaciónMachine Learning Best Practices Discussed on Stack ExchangeTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPIngeniería de softwareBuenas prácticasMachine learningDiseño de páginas webIngeniería201816347Publicationhttps://scholar.google.es/citations?user=55fmMcoAAAAJvirtual::7585-10000-0003-0161-2888virtual::7585-10cbe51ff-e35a-4c3a-ad77-609b3cdfc9b2virtual::7585-10cbe51ff-e35a-4c3a-ad77-609b3cdfc9b2virtual::7585-1THUMBNAIL26482.pdf.jpg26482.pdf.jpgIM Thumbnailimage/jpeg7038https://repositorio.uniandes.edu.co/bitstreams/b23799a8-baf8-4fea-875d-bfd70e211226/download61407eba9996ce60f133579592f41a11MD53TEXT26482.pdf.txt26482.pdf.txtExtracted texttext/plain48516https://repositorio.uniandes.edu.co/bitstreams/5cc75246-6157-45d2-b513-52133dfeba60/downloadbc58ea7c830c8c221ce0735022fee1c5MD52ORIGINAL26482.pdfapplication/pdf991653https://repositorio.uniandes.edu.co/bitstreams/131cbf84-9949-4133-a575-4046a7d268e4/downloade583db39a7c05dfc52989c0b4951032cMD511992/55704oai:repositorio.uniandes.edu.co:1992/557042024-03-13 13:28:12.243http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co