Estimación de datos faltantes a través de redes neuronales, una comparación con métodos simpes y múltiples

Encontrarse con valores faltantes en un conjunto de datos, es un problema muy frecuente y el no llevar a cabo un adecuado tratamiento puede causar sesgo en las estimaciones o alterar la varianza y distribución de los datos. Para ello, se propone implementar una técnica de imputación con redes neuron...

Full description

Autores:
Báez Vergara, Kelly Juliana
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad Santo Tomás
Repositorio:
Repositorio Institucional USTA
Idioma:
spa
OAI Identifier:
oai:repository.usta.edu.co:11634/42861
Acceso en línea:
http://hdl.handle.net/11634/42861
Palabra clave:
Missing values
Imputation
Neural networks
Datos
Estadística
Neuro ciencia
Datos faltantes
Imputación
Redes neuronales
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
id SANTTOMAS2_49a10cc2cf94e43bd7a3c1544876ac86
oai_identifier_str oai:repository.usta.edu.co:11634/42861
network_acronym_str SANTTOMAS2
network_name_str Repositorio Institucional USTA
repository_id_str
dc.title.spa.fl_str_mv Estimación de datos faltantes a través de redes neuronales, una comparación con métodos simpes y múltiples
title Estimación de datos faltantes a través de redes neuronales, una comparación con métodos simpes y múltiples
spellingShingle Estimación de datos faltantes a través de redes neuronales, una comparación con métodos simpes y múltiples
Missing values
Imputation
Neural networks
Datos
Estadística
Neuro ciencia
Datos faltantes
Imputación
Redes neuronales
title_short Estimación de datos faltantes a través de redes neuronales, una comparación con métodos simpes y múltiples
title_full Estimación de datos faltantes a través de redes neuronales, una comparación con métodos simpes y múltiples
title_fullStr Estimación de datos faltantes a través de redes neuronales, una comparación con métodos simpes y múltiples
title_full_unstemmed Estimación de datos faltantes a través de redes neuronales, una comparación con métodos simpes y múltiples
title_sort Estimación de datos faltantes a través de redes neuronales, una comparación con métodos simpes y múltiples
dc.creator.fl_str_mv Báez Vergara, Kelly Juliana
dc.contributor.advisor.none.fl_str_mv Romero, Gil Robert
dc.contributor.author.none.fl_str_mv Báez Vergara, Kelly Juliana
dc.contributor.orcid.spa.fl_str_mv https://orcid.org/0000-0001-8602-6890
dc.contributor.googlescholar.spa.fl_str_mv https://scholar.google.com/citations?user=LUEZqaYAAAAJ&hl=es
dc.contributor.corporatename.spa.fl_str_mv Universidad Santo Tomás
dc.subject.keyword.spa.fl_str_mv Missing values
Imputation
Neural networks
topic Missing values
Imputation
Neural networks
Datos
Estadística
Neuro ciencia
Datos faltantes
Imputación
Redes neuronales
dc.subject.lemb.spa.fl_str_mv Datos
Estadística
Neuro ciencia
dc.subject.proposal.spa.fl_str_mv Datos faltantes
Imputación
Redes neuronales
description Encontrarse con valores faltantes en un conjunto de datos, es un problema muy frecuente y el no llevar a cabo un adecuado tratamiento puede causar sesgo en las estimaciones o alterar la varianza y distribución de los datos. Para ello, se propone implementar una técnica de imputación con redes neuronales, y medir su eficiencia frente a métodos de imputación simples y múltiples.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-02-01T12:25:23Z
dc.date.available.none.fl_str_mv 2022-02-01T12:25:23Z
dc.date.issued.none.fl_str_mv 2022-01-27
dc.type.local.spa.fl_str_mv Trabajo de grado
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.category.spa.fl_str_mv Formación de Recurso Humano para la Ctel: Trabajo de grado de Pregrado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.drive.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.citation.spa.fl_str_mv Báez Vergara, K.J. (2022). Estimación de datos faltantes a través de redes neuronales, una comparación con métodos simples y múltiples. [Trabajo de Pregrado, Universidad Santo Tomás] Repositorio Institucional
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/11634/42861
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Universidad Santo Tomás
dc.identifier.instname.spa.fl_str_mv instname:Universidad Santo Tomás
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.usta.edu.co
identifier_str_mv Báez Vergara, K.J. (2022). Estimación de datos faltantes a través de redes neuronales, una comparación con métodos simples y múltiples. [Trabajo de Pregrado, Universidad Santo Tomás] Repositorio Institucional
reponame:Repositorio Institucional Universidad Santo Tomás
instname:Universidad Santo Tomás
repourl:https://repository.usta.edu.co
url http://hdl.handle.net/11634/42861
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Little, R. and Rubin, D., 2002. Statistical analysis with missing data. Hoboken: Wiley.
Basogain, X., n.d. [online] Ocw.ehu.eus. Available at: <https://ocw.ehu.eus/pluginfile.php/40137/mod_resource/content/1/redes_neuro/con tenidos/pdf/libro-del-curso.pdf>.
Useche Castro, Lelly María, Mesa Ávila, Dulce Maria Una introducción a la Imputación de Valores Perdidos. Terra. Nueva Etapa [en línea]. 2006, XXII(31), 127-151 ISSN: 1012-7089. Disponible en: https://www.redalyc.org/articulo.oa?id=72103106.
Li, C., 2013. Little's Test of Missing Completely at Random. The Stata Journal: Promoting communications on statistics and Stata, 13(4), pp.795-809.
Azur, M., Stuart, E., Frangakis, C. and Leaf, P., 2011. Multiple imputation by chained equations: what is it and how does it work?. International Journal of Methods in Psychiatric Research, 20(1), pp.40-49.
GitHub. 2021. GitHub - AnotherSamWilson/miceforest: Multiple Imputation with Random Forests in Python. [online] Available at: <https://github.com/AnotherSamWilson/miceforest>
Lall, R. and Robinson, T., 2021. The MIDAS Touch: Accurate and Scalable Missing-Data Imputation with Deep Learning. Political Analysis, pp.1-18.
Javadi, S., Bahrampour, A., Saber, M. M., Garrusi, B., & Baneshi, M. R. (2021). Evaluation of four multiple imputation methods for handling missing binary outcome data in the presence of an interaction between a dummy and a continuous variable. Journal of Probability and Statistics, 2021, 1–14. https://doi.org/10.1155/2021/6668822
(S/f). Mcgill.ca. (2021), de https://www.math.mcgill.ca/yyang/resources/doc/randomforest.pdf
Hastie, T., Tibshirani, R., & Friedman, J. (2009). Random Forests. In The Elements of Statistical Learning (pp. 587–604). Springer New York.
Woodford, C. (2011). How neural networks work - A simple introduction. Explain That Stuff. https://www.explainthatstuff.com/introduction-to-neural-networks.html 37
dc.rights.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
Atribución-NoComercial-SinDerivadas 2.5 Colombia
Atribución-NoComercial-SinDerivadas 2.5 Colombia
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.campus.spa.fl_str_mv CRAI-USTA Bogotá
dc.publisher.spa.fl_str_mv Universidad Santo Tomás
dc.publisher.program.spa.fl_str_mv Rregrado estadística
dc.publisher.faculty.spa.fl_str_mv Facultad de estadística
institution Universidad Santo Tomás
bitstream.url.fl_str_mv https://repository.usta.edu.co/bitstream/11634/42861/8/license_rdf
https://repository.usta.edu.co/bitstream/11634/42861/1/2022kellybaez.pdf
https://repository.usta.edu.co/bitstream/11634/42861/2/Carta_autorizacion_derechos_autor_ok.pdf
https://repository.usta.edu.co/bitstream/11634/42861/7/Carta%20aprobaci%c3%b3n%20facultad.pdf
https://repository.usta.edu.co/bitstream/11634/42861/9/license.txt
https://repository.usta.edu.co/bitstream/11634/42861/10/2022kellybaez.pdf.jpg
https://repository.usta.edu.co/bitstream/11634/42861/11/Carta_autorizacion_derechos_autor_ok.pdf.jpg
https://repository.usta.edu.co/bitstream/11634/42861/12/Carta%20aprobaci%c3%b3n%20facultad.pdf.jpg
bitstream.checksum.fl_str_mv 217700a34da79ed616c2feb68d4c5e06
24e4e15837022eab6738633b458dcc7e
8cc4b8e79c887f2758fd4af2798d27cb
d86d4f6948445e83f1c1b658e52eccd6
aedeaf396fcd827b537c73d23464fc27
f8d6d231081eb5e58970ae839dfdf07f
2a84eaf2cf422a08d53e8513bb42df2e
04f65397d934213f12a1a90c28eb3219
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Universidad Santo Tomás
repository.mail.fl_str_mv repositorio@usantotomas.edu.co
_version_ 1782026186606510080
spelling Romero, Gil RobertBáez Vergara, Kelly Julianahttps://orcid.org/0000-0001-8602-6890https://scholar.google.com/citations?user=LUEZqaYAAAAJ&hl=esUniversidad Santo Tomás2022-02-01T12:25:23Z2022-02-01T12:25:23Z2022-01-27Báez Vergara, K.J. (2022). Estimación de datos faltantes a través de redes neuronales, una comparación con métodos simples y múltiples. [Trabajo de Pregrado, Universidad Santo Tomás] Repositorio Institucionalhttp://hdl.handle.net/11634/42861reponame:Repositorio Institucional Universidad Santo Tomásinstname:Universidad Santo Tomásrepourl:https://repository.usta.edu.coEncontrarse con valores faltantes en un conjunto de datos, es un problema muy frecuente y el no llevar a cabo un adecuado tratamiento puede causar sesgo en las estimaciones o alterar la varianza y distribución de los datos. Para ello, se propone implementar una técnica de imputación con redes neuronales, y medir su eficiencia frente a métodos de imputación simples y múltiples.Finding missing values in a data set is a very frequent problem and not performing an adequate treatment can cause bias in the estimates or alter the variance and distribution of the data. For this, it is proposed to implement an imputation technique with neural networks, and measure its efficiency against simple and multiple imputation methods.Profesional en estadísticahttp://unidadinvestigacion.usta.edu.coPregradoapplication/pdfspaUniversidad Santo TomásRregrado estadísticaFacultad de estadísticaAtribución-NoComercial-SinDerivadas 2.5 ColombiaAtribución-NoComercial-SinDerivadas 2.5 ColombiaAtribución-NoComercial-SinDerivadas 2.5 Colombiahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Estimación de datos faltantes a través de redes neuronales, una comparación con métodos simpes y múltiplesMissing valuesImputationNeural networksDatosEstadísticaNeuro cienciaDatos faltantesImputaciónRedes neuronalesTrabajo de gradoinfo:eu-repo/semantics/acceptedVersionFormación de Recurso Humano para la Ctel: Trabajo de grado de Pregradohttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisCRAI-USTA BogotáLittle, R. and Rubin, D., 2002. Statistical analysis with missing data. Hoboken: Wiley.Basogain, X., n.d. [online] Ocw.ehu.eus. Available at: <https://ocw.ehu.eus/pluginfile.php/40137/mod_resource/content/1/redes_neuro/con tenidos/pdf/libro-del-curso.pdf>.Useche Castro, Lelly María, Mesa Ávila, Dulce Maria Una introducción a la Imputación de Valores Perdidos. Terra. Nueva Etapa [en línea]. 2006, XXII(31), 127-151 ISSN: 1012-7089. Disponible en: https://www.redalyc.org/articulo.oa?id=72103106.Li, C., 2013. Little's Test of Missing Completely at Random. The Stata Journal: Promoting communications on statistics and Stata, 13(4), pp.795-809.Azur, M., Stuart, E., Frangakis, C. and Leaf, P., 2011. Multiple imputation by chained equations: what is it and how does it work?. International Journal of Methods in Psychiatric Research, 20(1), pp.40-49.GitHub. 2021. GitHub - AnotherSamWilson/miceforest: Multiple Imputation with Random Forests in Python. [online] Available at: <https://github.com/AnotherSamWilson/miceforest>Lall, R. and Robinson, T., 2021. The MIDAS Touch: Accurate and Scalable Missing-Data Imputation with Deep Learning. Political Analysis, pp.1-18.Javadi, S., Bahrampour, A., Saber, M. M., Garrusi, B., & Baneshi, M. R. (2021). Evaluation of four multiple imputation methods for handling missing binary outcome data in the presence of an interaction between a dummy and a continuous variable. Journal of Probability and Statistics, 2021, 1–14. https://doi.org/10.1155/2021/6668822(S/f). Mcgill.ca. (2021), de https://www.math.mcgill.ca/yyang/resources/doc/randomforest.pdfHastie, T., Tibshirani, R., & Friedman, J. (2009). Random Forests. In The Elements of Statistical Learning (pp. 587–604). Springer New York.Woodford, C. (2011). How neural networks work - A simple introduction. Explain That Stuff. https://www.explainthatstuff.com/introduction-to-neural-networks.html 37CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repository.usta.edu.co/bitstream/11634/42861/8/license_rdf217700a34da79ed616c2feb68d4c5e06MD58open accessORIGINAL2022kellybaez.pdf2022kellybaez.pdfTrabajo de gradoapplication/pdf950032https://repository.usta.edu.co/bitstream/11634/42861/1/2022kellybaez.pdf24e4e15837022eab6738633b458dcc7eMD51open accessCarta_autorizacion_derechos_autor_ok.pdfCarta_autorizacion_derechos_autor_ok.pdfCarta derechos de autorapplication/pdf924471https://repository.usta.edu.co/bitstream/11634/42861/2/Carta_autorizacion_derechos_autor_ok.pdf8cc4b8e79c887f2758fd4af2798d27cbMD52metadata only accessCarta aprobación facultad.pdfCarta aprobación facultad.pdfCarta de aprobaciónapplication/pdf202758https://repository.usta.edu.co/bitstream/11634/42861/7/Carta%20aprobaci%c3%b3n%20facultad.pdfd86d4f6948445e83f1c1b658e52eccd6MD57metadata only accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8807https://repository.usta.edu.co/bitstream/11634/42861/9/license.txtaedeaf396fcd827b537c73d23464fc27MD59open accessTHUMBNAIL2022kellybaez.pdf.jpg2022kellybaez.pdf.jpgIM Thumbnailimage/jpeg5425https://repository.usta.edu.co/bitstream/11634/42861/10/2022kellybaez.pdf.jpgf8d6d231081eb5e58970ae839dfdf07fMD510open accessCarta_autorizacion_derechos_autor_ok.pdf.jpgCarta_autorizacion_derechos_autor_ok.pdf.jpgIM Thumbnailimage/jpeg7674https://repository.usta.edu.co/bitstream/11634/42861/11/Carta_autorizacion_derechos_autor_ok.pdf.jpg2a84eaf2cf422a08d53e8513bb42df2eMD511open accessCarta aprobación facultad.pdf.jpgCarta aprobación facultad.pdf.jpgIM Thumbnailimage/jpeg8716https://repository.usta.edu.co/bitstream/11634/42861/12/Carta%20aprobaci%c3%b3n%20facultad.pdf.jpg04f65397d934213f12a1a90c28eb3219MD512open access11634/42861oai:repository.usta.edu.co:11634/428612022-10-10 15:52:00.144open accessRepositorio Universidad Santo Tomásrepositorio@usantotomas.edu.coQXV0b3Jpem8gYWwgQ2VudHJvIGRlIFJlY3Vyc29zIHBhcmEgZWwgQXByZW5kaXphamUgeSBsYSBJbnZlc3RpZ2FjacOzbiwgQ1JBSS1VU1RBCmRlIGxhIFVuaXZlcnNpZGFkIFNhbnRvIFRvbcOhcywgcGFyYSBxdWUgY29uIGZpbmVzIGFjYWTDqW1pY29zIGFsbWFjZW5lIGxhCmluZm9ybWFjacOzbiBpbmdyZXNhZGEgcHJldmlhbWVudGUuCgpTZSBwZXJtaXRlIGxhIGNvbnN1bHRhLCByZXByb2R1Y2Npw7NuIHBhcmNpYWwsIHRvdGFsIG8gY2FtYmlvIGRlIGZvcm1hdG8gY29uCmZpbmVzIGRlIGNvbnNlcnZhY2nDs24sIGEgbG9zIHVzdWFyaW9zIGludGVyZXNhZG9zIGVuIGVsIGNvbnRlbmlkbyBkZSBlc3RlCnRyYWJham8sIHBhcmEgdG9kb3MgbG9zIHVzb3MgcXVlIHRlbmdhbiBmaW5hbGlkYWQgYWNhZMOpbWljYSwgc2llbXByZSB5IGN1YW5kbwptZWRpYW50ZSBsYSBjb3JyZXNwb25kaWVudGUgY2l0YSBiaWJsaW9ncsOhZmljYSBzZSBsZSBkw6kgY3LDqWRpdG8gYWwgdHJhYmFqbyBkZQpncmFkbyB5IGEgc3UgYXV0b3IuIERlIGNvbmZvcm1pZGFkIGNvbiBsbyBlc3RhYmxlY2lkbyBlbiBlbCBhcnTDrWN1bG8gMzAgZGUgbGEKTGV5IDIzIGRlIDE5ODIgeSBlbCBhcnTDrWN1bG8gMTEgZGUgbGEgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5Mywg4oCcTG9zIGRlcmVjaG9zCm1vcmFsZXMgc29icmUgZWwgdHJhYmFqbyBzb24gcHJvcGllZGFkIGRlIGxvcyBhdXRvcmVz4oCdLCBsb3MgY3VhbGVzIHNvbgppcnJlbnVuY2lhYmxlcywgaW1wcmVzY3JpcHRpYmxlcywgaW5lbWJhcmdhYmxlcyBlIGluYWxpZW5hYmxlcy4K