Detección de outliers multivariables mediante projection pursuit
Tanto en inferencia estadística como en el análisis de datos experimentales, ya sean univariables o multivariables. Es esencial evaluar la calidad de los datos sujetos a estudio. Es por ello que se hace necesario explorar y construir métodos que ayuden a la detección de ciertas observaciones que pue...
- Autores:
-
López Ríos, Victor Ignacio
- Tipo de recurso:
- Fecha de publicación:
- 1999
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/3081
- Palabra clave:
- 51 Matemáticas / Mathematics
Estadística
Análisis multivariante
Correlación (Estadística)
Simulación
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_467ec03db917f966c129bb76987059b8 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/3081 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Detección de outliers multivariables mediante projection pursuit |
title |
Detección de outliers multivariables mediante projection pursuit |
spellingShingle |
Detección de outliers multivariables mediante projection pursuit 51 Matemáticas / Mathematics Estadística Análisis multivariante Correlación (Estadística) Simulación |
title_short |
Detección de outliers multivariables mediante projection pursuit |
title_full |
Detección de outliers multivariables mediante projection pursuit |
title_fullStr |
Detección de outliers multivariables mediante projection pursuit |
title_full_unstemmed |
Detección de outliers multivariables mediante projection pursuit |
title_sort |
Detección de outliers multivariables mediante projection pursuit |
dc.creator.fl_str_mv |
López Ríos, Victor Ignacio |
dc.contributor.advisor.spa.fl_str_mv |
Correa Morales, Juan Carlos (Thesis advisor) |
dc.contributor.author.spa.fl_str_mv |
López Ríos, Victor Ignacio |
dc.subject.ddc.spa.fl_str_mv |
51 Matemáticas / Mathematics |
topic |
51 Matemáticas / Mathematics Estadística Análisis multivariante Correlación (Estadística) Simulación |
dc.subject.proposal.spa.fl_str_mv |
Estadística Análisis multivariante Correlación (Estadística) Simulación |
description |
Tanto en inferencia estadística como en el análisis de datos experimentales, ya sean univariables o multivariables. Es esencial evaluar la calidad de los datos sujetos a estudio. Es por ello que se hace necesario explorar y construir métodos que ayuden a la detección de ciertas observaciones que puedan afectar las medidas (correlaciones) en el caso multivariable. Estas observaciones se conocen en la literatura estadística como “outliers”. En el caso de univarible se han desarrollado muchos trabajos tanto informales como de tipo formal. Una extensa revisión bibliografía es presentada por Barnett y Lewis (1994) y por Beckman y Cook (1983). En el caso multivariable, la situación es diferente, la detección de outliers requiere de una exploración mucho mas detallada ya que estas observaciones no son tan fáciles de detectar visualmente por el problema de la dimensión: en este caso las técnicas de tipo formal que se han desarrollado son muy escasas debido principalmente a que las variables, en general, no cumplen el supuesto de independencia, lo cual no permite elaborar pruebas que presenten una buena potencia. Según Beckman y Cook (1983) los outliers en una muestra univariable se puede considerar como aquellas observaciones que en opinión del investigador se mantienen aparte o alejadas del volumen de los datos, conocidas en la literatura como:”observaciones discordantes”, “contaminantes”, “disidentes”, etc. También se consideran outliers aquellas observaciones que tienen la apariencia de desviarse notablemente de los otros miembros de la muestra en la cual ocurren. Las observaciones outliers son estudiadas para la detección de un fenómeno alternativo específico. Según Beckman y Cook (1983) los outliers pueden ser de distintos tipos: Observación discordante es aquella observación que parece sorprendente o discrepante para el investigador: Observación contaminante es aquella que no proviene de la población en estudio. Sino de otra población: Observación influyente es aquella que al ser excluida del análisis de datos, altera sustancialmente rasgos importantes de dicho análisis. En la detección de outliers se presentan varios problemas, entre otros: Una observación puede ser identificada como un outlier por un método dado y no por otro: Puede ser un outlier en un modelo y no en otro, y finalmente, en el caso multivariable, puede ser un outlier en un espacio p-dimensional y no lo es necesariamente en un subespacio dado. Por lo expuesto anteriormente, se hace necesario e importante, además de estudiar y revisar las técnicas que han sido propuestas. Explorar una nueva metodología de tipo informal. Que pueda detectar outliers en el caso de datos multivariables utilizando el enfoque por “Projection Pursuit”, buscando índices apropiados que permitan evaluar las proyecciones de los datos en diferentes subespacios. Los outliers que detectaremos son del tipo de observaciones discordantes. Adicionalmente, se desea evaluar la eficiencia de esta metodología comparándola con la técnica de componentes principales. |
publishDate |
1999 |
dc.date.issued.spa.fl_str_mv |
1999 |
dc.date.accessioned.spa.fl_str_mv |
2019-06-24T13:04:43Z |
dc.date.available.spa.fl_str_mv |
2019-06-24T13:04:43Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/3081 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/1495/ |
url |
https://repositorio.unal.edu.co/handle/unal/3081 http://bdigital.unal.edu.co/1495/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de Estadística Estadística Estadística |
dc.relation.references.spa.fl_str_mv |
López Ríos, Victor Ignacio (1999) Detección de outliers multivariables mediante projection pursuit. Maestría thesis, Universidad Nacional de Colombia Sede Medellín. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/3081/1/15383124.1999.pdf https://repositorio.unal.edu.co/bitstream/unal/3081/2/15383124.1999.pdf.jpg |
bitstream.checksum.fl_str_mv |
b4cb358df3971f575cabfbe6b39a86a0 e19ee129137e1ea56a8bd2380d365ec4 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089465768968192 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Correa Morales, Juan Carlos (Thesis advisor)5ce5bfe7-ef62-414b-a49c-747c8fecaff1-1López Ríos, Victor Ignacioa8b1eeb3-b1c3-4c21-b0ae-8d330f1ec33e3002019-06-24T13:04:43Z2019-06-24T13:04:43Z1999https://repositorio.unal.edu.co/handle/unal/3081http://bdigital.unal.edu.co/1495/Tanto en inferencia estadística como en el análisis de datos experimentales, ya sean univariables o multivariables. Es esencial evaluar la calidad de los datos sujetos a estudio. Es por ello que se hace necesario explorar y construir métodos que ayuden a la detección de ciertas observaciones que puedan afectar las medidas (correlaciones) en el caso multivariable. Estas observaciones se conocen en la literatura estadística como “outliers”. En el caso de univarible se han desarrollado muchos trabajos tanto informales como de tipo formal. Una extensa revisión bibliografía es presentada por Barnett y Lewis (1994) y por Beckman y Cook (1983). En el caso multivariable, la situación es diferente, la detección de outliers requiere de una exploración mucho mas detallada ya que estas observaciones no son tan fáciles de detectar visualmente por el problema de la dimensión: en este caso las técnicas de tipo formal que se han desarrollado son muy escasas debido principalmente a que las variables, en general, no cumplen el supuesto de independencia, lo cual no permite elaborar pruebas que presenten una buena potencia. Según Beckman y Cook (1983) los outliers en una muestra univariable se puede considerar como aquellas observaciones que en opinión del investigador se mantienen aparte o alejadas del volumen de los datos, conocidas en la literatura como:”observaciones discordantes”, “contaminantes”, “disidentes”, etc. También se consideran outliers aquellas observaciones que tienen la apariencia de desviarse notablemente de los otros miembros de la muestra en la cual ocurren. Las observaciones outliers son estudiadas para la detección de un fenómeno alternativo específico. Según Beckman y Cook (1983) los outliers pueden ser de distintos tipos: Observación discordante es aquella observación que parece sorprendente o discrepante para el investigador: Observación contaminante es aquella que no proviene de la población en estudio. Sino de otra población: Observación influyente es aquella que al ser excluida del análisis de datos, altera sustancialmente rasgos importantes de dicho análisis. En la detección de outliers se presentan varios problemas, entre otros: Una observación puede ser identificada como un outlier por un método dado y no por otro: Puede ser un outlier en un modelo y no en otro, y finalmente, en el caso multivariable, puede ser un outlier en un espacio p-dimensional y no lo es necesariamente en un subespacio dado. Por lo expuesto anteriormente, se hace necesario e importante, además de estudiar y revisar las técnicas que han sido propuestas. Explorar una nueva metodología de tipo informal. Que pueda detectar outliers en el caso de datos multivariables utilizando el enfoque por “Projection Pursuit”, buscando índices apropiados que permitan evaluar las proyecciones de los datos en diferentes subespacios. Los outliers que detectaremos son del tipo de observaciones discordantes. Adicionalmente, se desea evaluar la eficiencia de esta metodología comparándola con la técnica de componentes principales.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de Estadística EstadísticaEstadísticaLópez Ríos, Victor Ignacio (1999) Detección de outliers multivariables mediante projection pursuit. Maestría thesis, Universidad Nacional de Colombia Sede Medellín.51 Matemáticas / MathematicsEstadísticaAnálisis multivarianteCorrelación (Estadística)SimulaciónDetección de outliers multivariables mediante projection pursuitTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL15383124.1999.pdfTesis de Maestría en Ciencias - Estadísticaapplication/pdf6590650https://repositorio.unal.edu.co/bitstream/unal/3081/1/15383124.1999.pdfb4cb358df3971f575cabfbe6b39a86a0MD51THUMBNAIL15383124.1999.pdf.jpg15383124.1999.pdf.jpgGenerated Thumbnailimage/jpeg2635https://repositorio.unal.edu.co/bitstream/unal/3081/2/15383124.1999.pdf.jpge19ee129137e1ea56a8bd2380d365ec4MD52unal/3081oai:repositorio.unal.edu.co:unal/30812023-08-21 23:08:28.207Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |