El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos.

La estadística no paramétrica estudia los modelos necesarios para poder hacer inferencias de una o varias muestras de datos cuya distribución subyacente es desconocida ex-ante, y de esta manera no se ajusta a los usuales criterios y supuestos que permiten usar los modelos paramétricos. Por otro lado...

Full description

Autores:
Hernández López, Andrés Felipe
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/59223
Acceso en línea:
http://hdl.handle.net/1992/59223
Palabra clave:
Métodos no paramétricos
Problema de las dos muestras
Grafo
Matemáticas
Rights
openAccess
License
Attribution-NoDerivatives 4.0 Internacional
id UNIANDES2_839ffb317bf0fbca4b60a39f8c3fd22a
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/59223
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.none.fl_str_mv El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos.
title El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos.
spellingShingle El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos.
Métodos no paramétricos
Problema de las dos muestras
Grafo
Matemáticas
title_short El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos.
title_full El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos.
title_fullStr El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos.
title_full_unstemmed El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos.
title_sort El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos.
dc.creator.fl_str_mv Hernández López, Andrés Felipe
dc.contributor.advisor.none.fl_str_mv Arteaga Bejarano, José Ricardo
dc.contributor.author.none.fl_str_mv Hernández López, Andrés Felipe
dc.contributor.jury.none.fl_str_mv Quiroz Salazar, Adolfo José
dc.subject.keyword.none.fl_str_mv Métodos no paramétricos
Problema de las dos muestras
Grafo
topic Métodos no paramétricos
Problema de las dos muestras
Grafo
Matemáticas
dc.subject.themes.es_CO.fl_str_mv Matemáticas
description La estadística no paramétrica estudia los modelos necesarios para poder hacer inferencias de una o varias muestras de datos cuya distribución subyacente es desconocida ex-ante, y de esta manera no se ajusta a los usuales criterios y supuestos que permiten usar los modelos paramétricos. Por otro lado, el problema de las dos muestras evalúa si las distribuciones de dos muestras de datos distintas son semejantes en algún criterio, tal como la ubicación o la escala. En este proyecto de grado estudiaremos algunos métodos no perimétricos para el problema de las dos muestras que se basan en grafos. El primero de estos es la generalización del test usual de las corridas de Wald-Wolfowitz propuesta por Friedman y Rafsky en 1979; el segundo es la generalización planteada al test de Kolmogorov-Smirnov en ese mismo artículo.; la tercera es el test de los k-vecinos más cercanos propuesto por Schilling en 1986; y el último es el nuevo test propuesto por Chen y Friedman en el 2017. Finalmente se comparará las potencias de dichos métodos cambiando la cantidad de datos de la muestra, el número de dimensiones y la cantidad $k$ de vecinos más cercanos. Así se pondrá en evidencia las ventajas y debilidades de cada método en las distintas situaciones propuestas, con lo que se verá la versatilidad del método de Chen-Friedman frente a las alternativas de escala y ubicación.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-07-27T13:55:42Z
dc.date.available.none.fl_str_mv 2022-07-27T13:55:42Z
dc.date.issued.none.fl_str_mv 2022-06-07
dc.type.es_CO.fl_str_mv Trabajo de grado - Pregrado
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.es_CO.fl_str_mv Text
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/59223
dc.identifier.instname.es_CO.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.es_CO.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.es_CO.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/59223
identifier_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv spa
language spa
dc.relation.references.es_CO.fl_str_mv Barry, J. (1968). General and comparative study of the psychokynetic effect on a fungus culture. J. Parapsychology.
Chen, H. & Friedman, J. H. (2017). A New Graph-Based Two-Sample Test for Multivariate and Object Data. Journal of the American Statistical Association, 112 (517), 397-409.
Friedman, J. H. & Rafsky, L. C. (1979). Multivariate Generalizations of the Wald-Wolfowitz and Smirnov Two-Sample Tests. The Annals of Statistics, 7 (4), 283-298.
Gibbons, J. D. & Chakraborti, S. (2011). Nonparametric Statistical Inference (5.a ed.). Taylor; Francis Group.
Monaco, V. (2015). runs_test.py. https : / / gist . github . com / vmonaco / e9ff0ac61fcb3b1b60ba / revisions.
Randles, R. H. & Wolfe, D. A. (1979). Introduction to the Theory of Nonparametric Statistics. Krieger Publishinng Company.
Schilling, M. F. (1986a). Mutual and Shared Neighbor Probabilities: Finite- and Infinite-Dimensional Results. Advances in Applied Probability, 18 (2), 388-405.
Schilling, M. F. (1986b). Multivariate Two-Sample Tests Based on Nearest Neighbors. Journal of the American Statistical Association, 81 (395), 799-806.
dc.rights.license.spa.fl_str_mv Attribution-NoDerivatives 4.0 Internacional
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Attribution-NoDerivatives 4.0 Internacional
http://creativecommons.org/licenses/by-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 24 páginas.
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv Matemáticas
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ciencias
dc.publisher.department.es_CO.fl_str_mv Departamento de Matemáticas
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/5c8eba7b-3e58-4fae-ac3b-5294ff32783e/download
https://repositorio.uniandes.edu.co/bitstreams/d22d2a10-ad7c-49f9-9af7-692a81993546/download
https://repositorio.uniandes.edu.co/bitstreams/ea4360d0-8498-4026-86e6-f51d9554c0e6/download
https://repositorio.uniandes.edu.co/bitstreams/a2f32ea4-ebe5-4811-ab19-8aa3d63310c8/download
https://repositorio.uniandes.edu.co/bitstreams/93b0dd1b-3199-477c-812e-daaf29426ecc/download
https://repositorio.uniandes.edu.co/bitstreams/ac98fc00-bd62-41eb-b209-33279daeeaee/download
https://repositorio.uniandes.edu.co/bitstreams/bc98516c-a8ad-4df1-811a-f02ca54974df/download
https://repositorio.uniandes.edu.co/bitstreams/4cc34163-feaa-430f-9f53-b9ebd7720ed3/download
bitstream.checksum.fl_str_mv 5aa5c691a1ffe97abd12c2966efcb8d6
b91e04865a18d83d737cc3b742f9fa74
968e136814f049e6f72606dfb2276029
41132e89b62e343676a3f806d371e11e
c64c243b446961c32be4674b053ac921
f7d494f61e544413a13e6ba1da2089cd
217062962c789372888c28a017659669
4491fe1afb58beaaef41a73cf7ff2e27
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133938369396736
spelling Attribution-NoDerivatives 4.0 Internacionalhttp://creativecommons.org/licenses/by-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Arteaga Bejarano, José Ricardovirtual::8827-1Hernández López, Andrés Felipe553b12ac-18d9-4651-8cea-b026952be003600Quiroz Salazar, Adolfo José2022-07-27T13:55:42Z2022-07-27T13:55:42Z2022-06-07http://hdl.handle.net/1992/59223instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/La estadística no paramétrica estudia los modelos necesarios para poder hacer inferencias de una o varias muestras de datos cuya distribución subyacente es desconocida ex-ante, y de esta manera no se ajusta a los usuales criterios y supuestos que permiten usar los modelos paramétricos. Por otro lado, el problema de las dos muestras evalúa si las distribuciones de dos muestras de datos distintas son semejantes en algún criterio, tal como la ubicación o la escala. En este proyecto de grado estudiaremos algunos métodos no perimétricos para el problema de las dos muestras que se basan en grafos. El primero de estos es la generalización del test usual de las corridas de Wald-Wolfowitz propuesta por Friedman y Rafsky en 1979; el segundo es la generalización planteada al test de Kolmogorov-Smirnov en ese mismo artículo.; la tercera es el test de los k-vecinos más cercanos propuesto por Schilling en 1986; y el último es el nuevo test propuesto por Chen y Friedman en el 2017. Finalmente se comparará las potencias de dichos métodos cambiando la cantidad de datos de la muestra, el número de dimensiones y la cantidad $k$ de vecinos más cercanos. Así se pondrá en evidencia las ventajas y debilidades de cada método en las distintas situaciones propuestas, con lo que se verá la versatilidad del método de Chen-Friedman frente a las alternativas de escala y ubicación.MatemáticoPregrado24 páginas.application/pdfspaUniversidad de los AndesMatemáticasFacultad de CienciasDepartamento de MatemáticasEl problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos.Trabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPMétodos no paramétricosProblema de las dos muestrasGrafoMatemáticasBarry, J. (1968). General and comparative study of the psychokynetic effect on a fungus culture. J. Parapsychology.Chen, H. & Friedman, J. H. (2017). A New Graph-Based Two-Sample Test for Multivariate and Object Data. Journal of the American Statistical Association, 112 (517), 397-409.Friedman, J. H. & Rafsky, L. C. (1979). Multivariate Generalizations of the Wald-Wolfowitz and Smirnov Two-Sample Tests. The Annals of Statistics, 7 (4), 283-298.Gibbons, J. D. & Chakraborti, S. (2011). Nonparametric Statistical Inference (5.a ed.). Taylor; Francis Group.Monaco, V. (2015). runs_test.py. https : / / gist . github . com / vmonaco / e9ff0ac61fcb3b1b60ba / revisions.Randles, R. H. & Wolfe, D. A. (1979). Introduction to the Theory of Nonparametric Statistics. Krieger Publishinng Company.Schilling, M. F. (1986a). Mutual and Shared Neighbor Probabilities: Finite- and Infinite-Dimensional Results. Advances in Applied Probability, 18 (2), 388-405.Schilling, M. F. (1986b). Multivariate Two-Sample Tests Based on Nearest Neighbors. Journal of the American Statistical Association, 81 (395), 799-806.201728939Publication57d0eba4-5ff9-4f18-a510-2792de35015cvirtual::8827-157d0eba4-5ff9-4f18-a510-2792de35015cvirtual::8827-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000054739virtual::8827-1LICENSElicense.txtlicense.txttext/plain; charset=utf-81810https://repositorio.uniandes.edu.co/bitstreams/5c8eba7b-3e58-4fae-ac3b-5294ff32783e/download5aa5c691a1ffe97abd12c2966efcb8d6MD54THUMBNAILEl problema multivariado de las dos muestras_una aprocimacion desde metodos no parametricos basados en grafos.pdf.jpgEl problema multivariado de las dos muestras_una aprocimacion desde metodos no parametricos basados en grafos.pdf.jpgIM Thumbnailimage/jpeg7448https://repositorio.uniandes.edu.co/bitstreams/d22d2a10-ad7c-49f9-9af7-692a81993546/downloadb91e04865a18d83d737cc3b742f9fa74MD57formato de autorizacion y entrega de trabajo de grado al sistema de bibliotecas.pdf.jpgformato de autorizacion y entrega de trabajo de grado al sistema de bibliotecas.pdf.jpgIM Thumbnailimage/jpeg16132https://repositorio.uniandes.edu.co/bitstreams/ea4360d0-8498-4026-86e6-f51d9554c0e6/download968e136814f049e6f72606dfb2276029MD59ORIGINALEl problema multivariado de las dos muestras_una aprocimacion desde metodos no parametricos basados en grafos.pdfEl problema multivariado de las dos muestras_una aprocimacion desde metodos no parametricos basados en grafos.pdfTrabajo de gradoapplication/pdf695269https://repositorio.uniandes.edu.co/bitstreams/a2f32ea4-ebe5-4811-ab19-8aa3d63310c8/download41132e89b62e343676a3f806d371e11eMD53formato de autorizacion y entrega de trabajo de grado al sistema de bibliotecas.pdfformato de autorizacion y entrega de trabajo de grado al sistema de bibliotecas.pdfHIDEapplication/pdf226361https://repositorio.uniandes.edu.co/bitstreams/93b0dd1b-3199-477c-812e-daaf29426ecc/downloadc64c243b446961c32be4674b053ac921MD55CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8799https://repositorio.uniandes.edu.co/bitstreams/ac98fc00-bd62-41eb-b209-33279daeeaee/downloadf7d494f61e544413a13e6ba1da2089cdMD52TEXTEl problema multivariado de las dos muestras_una aprocimacion desde metodos no parametricos basados en grafos.pdf.txtEl problema multivariado de las dos muestras_una aprocimacion desde metodos no parametricos basados en grafos.pdf.txtExtracted texttext/plain57841https://repositorio.uniandes.edu.co/bitstreams/bc98516c-a8ad-4df1-811a-f02ca54974df/download217062962c789372888c28a017659669MD56formato de autorizacion y entrega de trabajo de grado al sistema de bibliotecas.pdf.txtformato de autorizacion y entrega de trabajo de grado al sistema de bibliotecas.pdf.txtExtracted texttext/plain1163https://repositorio.uniandes.edu.co/bitstreams/4cc34163-feaa-430f-9f53-b9ebd7720ed3/download4491fe1afb58beaaef41a73cf7ff2e27MD581992/59223oai:repositorio.uniandes.edu.co:1992/592232024-03-13 13:46:48.362http://creativecommons.org/licenses/by-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coWW8sIGVuIG1pIGNhbGlkYWQgZGUgYXV0b3IgZGVsIHRyYWJham8gZGUgdGVzaXMsIG1vbm9ncmFmw61hIG8gdHJhYmFqbyBkZSBncmFkbywgaGFnbyBlbnRyZWdhIGRlbCBlamVtcGxhciByZXNwZWN0aXZvIHkgZGUgc3VzIGFuZXhvcyBkZSBzZXIgZWwgY2FzbywgZW4gZm9ybWF0byBkaWdpdGFsIHkvbyBlbGVjdHLDs25pY28geSBhdXRvcml6byBhIGxhIFVuaXZlcnNpZGFkIGRlIGxvcyBBbmRlcyBwYXJhIHF1ZSByZWFsaWNlIGxhIHB1YmxpY2FjacOzbiBlbiBlbCBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIG8gZW4gY3VhbHF1aWVyIG90cm8gc2lzdGVtYSBvIGJhc2UgZGUgZGF0b3MgcHJvcGlvIG8gYWplbm8gYSBsYSBVbml2ZXJzaWRhZCB5IHBhcmEgcXVlIGVuIGxvcyB0w6lybWlub3MgZXN0YWJsZWNpZG9zIGVuIGxhIExleSAyMyBkZSAxOTgyLCBMZXkgNDQgZGUgMTk5MywgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5MywgRGVjcmV0byA0NjAgZGUgMTk5NSB5IGRlbcOhcyBub3JtYXMgZ2VuZXJhbGVzIHNvYnJlIGxhIG1hdGVyaWEsIHV0aWxpY2UgZW4gdG9kYXMgc3VzIGZvcm1hcywgbG9zIGRlcmVjaG9zIHBhdHJpbW9uaWFsZXMgZGUgcmVwcm9kdWNjacOzbiwgY29tdW5pY2FjacOzbiBww7pibGljYSwgdHJhbnNmb3JtYWNpw7NuIHkgZGlzdHJpYnVjacOzbiAoYWxxdWlsZXIsIHByw6lzdGFtbyBww7pibGljbyBlIGltcG9ydGFjacOzbikgcXVlIG1lIGNvcnJlc3BvbmRlbiBjb21vIGNyZWFkb3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50by4gIAoKCkxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgZW1pdGUgZW4gY2FsaWRhZCBkZSBhdXRvciBkZSBsYSBvYnJhIG9iamV0byBkZWwgcHJlc2VudGUgZG9jdW1lbnRvIHkgbm8gY29ycmVzcG9uZGUgYSBjZXNpw7NuIGRlIGRlcmVjaG9zLCBzaW5vIGEgbGEgYXV0b3JpemFjacOzbiBkZSB1c28gYWNhZMOpbWljbyBkZSBjb25mb3JtaWRhZCBjb24gbG8gYW50ZXJpb3JtZW50ZSBzZcOxYWxhZG8uIExhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgaGFjZSBleHRlbnNpdmEgbm8gc29sbyBhIGxhcyBmYWN1bHRhZGVzIHkgZGVyZWNob3MgZGUgdXNvIHNvYnJlIGxhIG9icmEgZW4gZm9ybWF0byBvIHNvcG9ydGUgbWF0ZXJpYWwsIHNpbm8gdGFtYmnDqW4gcGFyYSBmb3JtYXRvIGVsZWN0csOzbmljbywgeSBlbiBnZW5lcmFsIHBhcmEgY3VhbHF1aWVyIGZvcm1hdG8gY29ub2NpZG8gbyBwb3IgY29ub2Nlci4gCgoKRWwgYXV0b3IsIG1hbmlmaWVzdGEgcXVlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gZXMgb3JpZ2luYWwgeSBsYSByZWFsaXrDsyBzaW4gdmlvbGFyIG8gdXN1cnBhciBkZXJlY2hvcyBkZSBhdXRvciBkZSB0ZXJjZXJvcywgcG9yIGxvIHRhbnRvLCBsYSBvYnJhIGVzIGRlIHN1IGV4Y2x1c2l2YSBhdXRvcsOtYSB5IHRpZW5lIGxhIHRpdHVsYXJpZGFkIHNvYnJlIGxhIG1pc21hLiAKCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLiAKCg==