El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos.
La estadística no paramétrica estudia los modelos necesarios para poder hacer inferencias de una o varias muestras de datos cuya distribución subyacente es desconocida ex-ante, y de esta manera no se ajusta a los usuales criterios y supuestos que permiten usar los modelos paramétricos. Por otro lado...
- Autores:
-
Hernández López, Andrés Felipe
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2022
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/59223
- Acceso en línea:
- http://hdl.handle.net/1992/59223
- Palabra clave:
- Métodos no paramétricos
Problema de las dos muestras
Grafo
Matemáticas
- Rights
- openAccess
- License
- Attribution-NoDerivatives 4.0 Internacional
id |
UNIANDES2_839ffb317bf0fbca4b60a39f8c3fd22a |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/59223 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.none.fl_str_mv |
El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos. |
title |
El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos. |
spellingShingle |
El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos. Métodos no paramétricos Problema de las dos muestras Grafo Matemáticas |
title_short |
El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos. |
title_full |
El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos. |
title_fullStr |
El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos. |
title_full_unstemmed |
El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos. |
title_sort |
El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos. |
dc.creator.fl_str_mv |
Hernández López, Andrés Felipe |
dc.contributor.advisor.none.fl_str_mv |
Arteaga Bejarano, José Ricardo |
dc.contributor.author.none.fl_str_mv |
Hernández López, Andrés Felipe |
dc.contributor.jury.none.fl_str_mv |
Quiroz Salazar, Adolfo José |
dc.subject.keyword.none.fl_str_mv |
Métodos no paramétricos Problema de las dos muestras Grafo |
topic |
Métodos no paramétricos Problema de las dos muestras Grafo Matemáticas |
dc.subject.themes.es_CO.fl_str_mv |
Matemáticas |
description |
La estadística no paramétrica estudia los modelos necesarios para poder hacer inferencias de una o varias muestras de datos cuya distribución subyacente es desconocida ex-ante, y de esta manera no se ajusta a los usuales criterios y supuestos que permiten usar los modelos paramétricos. Por otro lado, el problema de las dos muestras evalúa si las distribuciones de dos muestras de datos distintas son semejantes en algún criterio, tal como la ubicación o la escala. En este proyecto de grado estudiaremos algunos métodos no perimétricos para el problema de las dos muestras que se basan en grafos. El primero de estos es la generalización del test usual de las corridas de Wald-Wolfowitz propuesta por Friedman y Rafsky en 1979; el segundo es la generalización planteada al test de Kolmogorov-Smirnov en ese mismo artículo.; la tercera es el test de los k-vecinos más cercanos propuesto por Schilling en 1986; y el último es el nuevo test propuesto por Chen y Friedman en el 2017. Finalmente se comparará las potencias de dichos métodos cambiando la cantidad de datos de la muestra, el número de dimensiones y la cantidad $k$ de vecinos más cercanos. Así se pondrá en evidencia las ventajas y debilidades de cada método en las distintas situaciones propuestas, con lo que se verá la versatilidad del método de Chen-Friedman frente a las alternativas de escala y ubicación. |
publishDate |
2022 |
dc.date.accessioned.none.fl_str_mv |
2022-07-27T13:55:42Z |
dc.date.available.none.fl_str_mv |
2022-07-27T13:55:42Z |
dc.date.issued.none.fl_str_mv |
2022-06-07 |
dc.type.es_CO.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.version.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.es_CO.fl_str_mv |
Text |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/59223 |
dc.identifier.instname.es_CO.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.es_CO.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.es_CO.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/59223 |
identifier_str_mv |
instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.es_CO.fl_str_mv |
spa |
language |
spa |
dc.relation.references.es_CO.fl_str_mv |
Barry, J. (1968). General and comparative study of the psychokynetic effect on a fungus culture. J. Parapsychology. Chen, H. & Friedman, J. H. (2017). A New Graph-Based Two-Sample Test for Multivariate and Object Data. Journal of the American Statistical Association, 112 (517), 397-409. Friedman, J. H. & Rafsky, L. C. (1979). Multivariate Generalizations of the Wald-Wolfowitz and Smirnov Two-Sample Tests. The Annals of Statistics, 7 (4), 283-298. Gibbons, J. D. & Chakraborti, S. (2011). Nonparametric Statistical Inference (5.a ed.). Taylor; Francis Group. Monaco, V. (2015). runs_test.py. https : / / gist . github . com / vmonaco / e9ff0ac61fcb3b1b60ba / revisions. Randles, R. H. & Wolfe, D. A. (1979). Introduction to the Theory of Nonparametric Statistics. Krieger Publishinng Company. Schilling, M. F. (1986a). Mutual and Shared Neighbor Probabilities: Finite- and Infinite-Dimensional Results. Advances in Applied Probability, 18 (2), 388-405. Schilling, M. F. (1986b). Multivariate Two-Sample Tests Based on Nearest Neighbors. Journal of the American Statistical Association, 81 (395), 799-806. |
dc.rights.license.spa.fl_str_mv |
Attribution-NoDerivatives 4.0 Internacional |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nd/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Attribution-NoDerivatives 4.0 Internacional http://creativecommons.org/licenses/by-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.es_CO.fl_str_mv |
24 páginas. |
dc.format.mimetype.es_CO.fl_str_mv |
application/pdf |
dc.publisher.es_CO.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.es_CO.fl_str_mv |
Matemáticas |
dc.publisher.faculty.es_CO.fl_str_mv |
Facultad de Ciencias |
dc.publisher.department.es_CO.fl_str_mv |
Departamento de Matemáticas |
institution |
Universidad de los Andes |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/5c8eba7b-3e58-4fae-ac3b-5294ff32783e/download https://repositorio.uniandes.edu.co/bitstreams/d22d2a10-ad7c-49f9-9af7-692a81993546/download https://repositorio.uniandes.edu.co/bitstreams/ea4360d0-8498-4026-86e6-f51d9554c0e6/download https://repositorio.uniandes.edu.co/bitstreams/a2f32ea4-ebe5-4811-ab19-8aa3d63310c8/download https://repositorio.uniandes.edu.co/bitstreams/93b0dd1b-3199-477c-812e-daaf29426ecc/download https://repositorio.uniandes.edu.co/bitstreams/ac98fc00-bd62-41eb-b209-33279daeeaee/download https://repositorio.uniandes.edu.co/bitstreams/bc98516c-a8ad-4df1-811a-f02ca54974df/download https://repositorio.uniandes.edu.co/bitstreams/4cc34163-feaa-430f-9f53-b9ebd7720ed3/download |
bitstream.checksum.fl_str_mv |
5aa5c691a1ffe97abd12c2966efcb8d6 b91e04865a18d83d737cc3b742f9fa74 968e136814f049e6f72606dfb2276029 41132e89b62e343676a3f806d371e11e c64c243b446961c32be4674b053ac921 f7d494f61e544413a13e6ba1da2089cd 217062962c789372888c28a017659669 4491fe1afb58beaaef41a73cf7ff2e27 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812133938369396736 |
spelling |
Attribution-NoDerivatives 4.0 Internacionalhttp://creativecommons.org/licenses/by-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Arteaga Bejarano, José Ricardovirtual::8827-1Hernández López, Andrés Felipe553b12ac-18d9-4651-8cea-b026952be003600Quiroz Salazar, Adolfo José2022-07-27T13:55:42Z2022-07-27T13:55:42Z2022-06-07http://hdl.handle.net/1992/59223instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/La estadística no paramétrica estudia los modelos necesarios para poder hacer inferencias de una o varias muestras de datos cuya distribución subyacente es desconocida ex-ante, y de esta manera no se ajusta a los usuales criterios y supuestos que permiten usar los modelos paramétricos. Por otro lado, el problema de las dos muestras evalúa si las distribuciones de dos muestras de datos distintas son semejantes en algún criterio, tal como la ubicación o la escala. En este proyecto de grado estudiaremos algunos métodos no perimétricos para el problema de las dos muestras que se basan en grafos. El primero de estos es la generalización del test usual de las corridas de Wald-Wolfowitz propuesta por Friedman y Rafsky en 1979; el segundo es la generalización planteada al test de Kolmogorov-Smirnov en ese mismo artículo.; la tercera es el test de los k-vecinos más cercanos propuesto por Schilling en 1986; y el último es el nuevo test propuesto por Chen y Friedman en el 2017. Finalmente se comparará las potencias de dichos métodos cambiando la cantidad de datos de la muestra, el número de dimensiones y la cantidad $k$ de vecinos más cercanos. Así se pondrá en evidencia las ventajas y debilidades de cada método en las distintas situaciones propuestas, con lo que se verá la versatilidad del método de Chen-Friedman frente a las alternativas de escala y ubicación.MatemáticoPregrado24 páginas.application/pdfspaUniversidad de los AndesMatemáticasFacultad de CienciasDepartamento de MatemáticasEl problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos.Trabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPMétodos no paramétricosProblema de las dos muestrasGrafoMatemáticasBarry, J. (1968). General and comparative study of the psychokynetic effect on a fungus culture. J. Parapsychology.Chen, H. & Friedman, J. H. (2017). A New Graph-Based Two-Sample Test for Multivariate and Object Data. Journal of the American Statistical Association, 112 (517), 397-409.Friedman, J. H. & Rafsky, L. C. (1979). Multivariate Generalizations of the Wald-Wolfowitz and Smirnov Two-Sample Tests. The Annals of Statistics, 7 (4), 283-298.Gibbons, J. D. & Chakraborti, S. (2011). Nonparametric Statistical Inference (5.a ed.). Taylor; Francis Group.Monaco, V. (2015). runs_test.py. https : / / gist . github . com / vmonaco / e9ff0ac61fcb3b1b60ba / revisions.Randles, R. H. & Wolfe, D. A. (1979). Introduction to the Theory of Nonparametric Statistics. Krieger Publishinng Company.Schilling, M. F. (1986a). Mutual and Shared Neighbor Probabilities: Finite- and Infinite-Dimensional Results. Advances in Applied Probability, 18 (2), 388-405.Schilling, M. F. (1986b). Multivariate Two-Sample Tests Based on Nearest Neighbors. Journal of the American Statistical Association, 81 (395), 799-806.201728939Publication57d0eba4-5ff9-4f18-a510-2792de35015cvirtual::8827-157d0eba4-5ff9-4f18-a510-2792de35015cvirtual::8827-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000054739virtual::8827-1LICENSElicense.txtlicense.txttext/plain; charset=utf-81810https://repositorio.uniandes.edu.co/bitstreams/5c8eba7b-3e58-4fae-ac3b-5294ff32783e/download5aa5c691a1ffe97abd12c2966efcb8d6MD54THUMBNAILEl problema multivariado de las dos muestras_una aprocimacion desde metodos no parametricos basados en grafos.pdf.jpgEl problema multivariado de las dos muestras_una aprocimacion desde metodos no parametricos basados en grafos.pdf.jpgIM Thumbnailimage/jpeg7448https://repositorio.uniandes.edu.co/bitstreams/d22d2a10-ad7c-49f9-9af7-692a81993546/downloadb91e04865a18d83d737cc3b742f9fa74MD57formato de autorizacion y entrega de trabajo de grado al sistema de bibliotecas.pdf.jpgformato de autorizacion y entrega de trabajo de grado al sistema de bibliotecas.pdf.jpgIM Thumbnailimage/jpeg16132https://repositorio.uniandes.edu.co/bitstreams/ea4360d0-8498-4026-86e6-f51d9554c0e6/download968e136814f049e6f72606dfb2276029MD59ORIGINALEl problema multivariado de las dos muestras_una aprocimacion desde metodos no parametricos basados en grafos.pdfEl problema multivariado de las dos muestras_una aprocimacion desde metodos no parametricos basados en grafos.pdfTrabajo de gradoapplication/pdf695269https://repositorio.uniandes.edu.co/bitstreams/a2f32ea4-ebe5-4811-ab19-8aa3d63310c8/download41132e89b62e343676a3f806d371e11eMD53formato de autorizacion y entrega de trabajo de grado al sistema de bibliotecas.pdfformato de autorizacion y entrega de trabajo de grado al sistema de bibliotecas.pdfHIDEapplication/pdf226361https://repositorio.uniandes.edu.co/bitstreams/93b0dd1b-3199-477c-812e-daaf29426ecc/downloadc64c243b446961c32be4674b053ac921MD55CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8799https://repositorio.uniandes.edu.co/bitstreams/ac98fc00-bd62-41eb-b209-33279daeeaee/downloadf7d494f61e544413a13e6ba1da2089cdMD52TEXTEl problema multivariado de las dos muestras_una aprocimacion desde metodos no parametricos basados en grafos.pdf.txtEl problema multivariado de las dos muestras_una aprocimacion desde metodos no parametricos basados en grafos.pdf.txtExtracted texttext/plain57841https://repositorio.uniandes.edu.co/bitstreams/bc98516c-a8ad-4df1-811a-f02ca54974df/download217062962c789372888c28a017659669MD56formato de autorizacion y entrega de trabajo de grado al sistema de bibliotecas.pdf.txtformato de autorizacion y entrega de trabajo de grado al sistema de bibliotecas.pdf.txtExtracted texttext/plain1163https://repositorio.uniandes.edu.co/bitstreams/4cc34163-feaa-430f-9f53-b9ebd7720ed3/download4491fe1afb58beaaef41a73cf7ff2e27MD581992/59223oai:repositorio.uniandes.edu.co:1992/592232024-03-13 13:46:48.362http://creativecommons.org/licenses/by-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coWW8sIGVuIG1pIGNhbGlkYWQgZGUgYXV0b3IgZGVsIHRyYWJham8gZGUgdGVzaXMsIG1vbm9ncmFmw61hIG8gdHJhYmFqbyBkZSBncmFkbywgaGFnbyBlbnRyZWdhIGRlbCBlamVtcGxhciByZXNwZWN0aXZvIHkgZGUgc3VzIGFuZXhvcyBkZSBzZXIgZWwgY2FzbywgZW4gZm9ybWF0byBkaWdpdGFsIHkvbyBlbGVjdHLDs25pY28geSBhdXRvcml6byBhIGxhIFVuaXZlcnNpZGFkIGRlIGxvcyBBbmRlcyBwYXJhIHF1ZSByZWFsaWNlIGxhIHB1YmxpY2FjacOzbiBlbiBlbCBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIG8gZW4gY3VhbHF1aWVyIG90cm8gc2lzdGVtYSBvIGJhc2UgZGUgZGF0b3MgcHJvcGlvIG8gYWplbm8gYSBsYSBVbml2ZXJzaWRhZCB5IHBhcmEgcXVlIGVuIGxvcyB0w6lybWlub3MgZXN0YWJsZWNpZG9zIGVuIGxhIExleSAyMyBkZSAxOTgyLCBMZXkgNDQgZGUgMTk5MywgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5MywgRGVjcmV0byA0NjAgZGUgMTk5NSB5IGRlbcOhcyBub3JtYXMgZ2VuZXJhbGVzIHNvYnJlIGxhIG1hdGVyaWEsIHV0aWxpY2UgZW4gdG9kYXMgc3VzIGZvcm1hcywgbG9zIGRlcmVjaG9zIHBhdHJpbW9uaWFsZXMgZGUgcmVwcm9kdWNjacOzbiwgY29tdW5pY2FjacOzbiBww7pibGljYSwgdHJhbnNmb3JtYWNpw7NuIHkgZGlzdHJpYnVjacOzbiAoYWxxdWlsZXIsIHByw6lzdGFtbyBww7pibGljbyBlIGltcG9ydGFjacOzbikgcXVlIG1lIGNvcnJlc3BvbmRlbiBjb21vIGNyZWFkb3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50by4gIAoKCkxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgZW1pdGUgZW4gY2FsaWRhZCBkZSBhdXRvciBkZSBsYSBvYnJhIG9iamV0byBkZWwgcHJlc2VudGUgZG9jdW1lbnRvIHkgbm8gY29ycmVzcG9uZGUgYSBjZXNpw7NuIGRlIGRlcmVjaG9zLCBzaW5vIGEgbGEgYXV0b3JpemFjacOzbiBkZSB1c28gYWNhZMOpbWljbyBkZSBjb25mb3JtaWRhZCBjb24gbG8gYW50ZXJpb3JtZW50ZSBzZcOxYWxhZG8uIExhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gc2UgaGFjZSBleHRlbnNpdmEgbm8gc29sbyBhIGxhcyBmYWN1bHRhZGVzIHkgZGVyZWNob3MgZGUgdXNvIHNvYnJlIGxhIG9icmEgZW4gZm9ybWF0byBvIHNvcG9ydGUgbWF0ZXJpYWwsIHNpbm8gdGFtYmnDqW4gcGFyYSBmb3JtYXRvIGVsZWN0csOzbmljbywgeSBlbiBnZW5lcmFsIHBhcmEgY3VhbHF1aWVyIGZvcm1hdG8gY29ub2NpZG8gbyBwb3IgY29ub2Nlci4gCgoKRWwgYXV0b3IsIG1hbmlmaWVzdGEgcXVlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gZXMgb3JpZ2luYWwgeSBsYSByZWFsaXrDsyBzaW4gdmlvbGFyIG8gdXN1cnBhciBkZXJlY2hvcyBkZSBhdXRvciBkZSB0ZXJjZXJvcywgcG9yIGxvIHRhbnRvLCBsYSBvYnJhIGVzIGRlIHN1IGV4Y2x1c2l2YSBhdXRvcsOtYSB5IHRpZW5lIGxhIHRpdHVsYXJpZGFkIHNvYnJlIGxhIG1pc21hLiAKCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLiAKCg== |