Detección de outliers multivariables mediante projection pursuit

Tanto en inferencia estadística como en el análisis de datos experimentales, ya sean univariables o multivariables. Es esencial evaluar la calidad de los datos sujetos a estudio. Es por ello que se hace necesario explorar y construir métodos que ayuden a la detección de ciertas observaciones que pue...

Full description

Autores:
López Ríos, Victor Ignacio
Tipo de recurso:
Fecha de publicación:
1999
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/3081
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/3081
http://bdigital.unal.edu.co/1495/
Palabra clave:
51 Matemáticas / Mathematics
Estadística
Análisis multivariante
Correlación (Estadística)
Simulación
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_467ec03db917f966c129bb76987059b8
oai_identifier_str oai:repositorio.unal.edu.co:unal/3081
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Detección de outliers multivariables mediante projection pursuit
title Detección de outliers multivariables mediante projection pursuit
spellingShingle Detección de outliers multivariables mediante projection pursuit
51 Matemáticas / Mathematics
Estadística
Análisis multivariante
Correlación (Estadística)
Simulación
title_short Detección de outliers multivariables mediante projection pursuit
title_full Detección de outliers multivariables mediante projection pursuit
title_fullStr Detección de outliers multivariables mediante projection pursuit
title_full_unstemmed Detección de outliers multivariables mediante projection pursuit
title_sort Detección de outliers multivariables mediante projection pursuit
dc.creator.fl_str_mv López Ríos, Victor Ignacio
dc.contributor.advisor.spa.fl_str_mv Correa Morales, Juan Carlos (Thesis advisor)
dc.contributor.author.spa.fl_str_mv López Ríos, Victor Ignacio
dc.subject.ddc.spa.fl_str_mv 51 Matemáticas / Mathematics
topic 51 Matemáticas / Mathematics
Estadística
Análisis multivariante
Correlación (Estadística)
Simulación
dc.subject.proposal.spa.fl_str_mv Estadística
Análisis multivariante
Correlación (Estadística)
Simulación
description Tanto en inferencia estadística como en el análisis de datos experimentales, ya sean univariables o multivariables. Es esencial evaluar la calidad de los datos sujetos a estudio. Es por ello que se hace necesario explorar y construir métodos que ayuden a la detección de ciertas observaciones que puedan afectar las medidas (correlaciones) en el caso multivariable. Estas observaciones se conocen en la literatura estadística como “outliers”. En el caso de univarible se han desarrollado muchos trabajos tanto informales como de tipo formal. Una extensa revisión bibliografía es presentada por Barnett y Lewis (1994) y por Beckman y Cook (1983). En el caso multivariable, la situación es diferente, la detección de outliers requiere de una exploración mucho mas detallada ya que estas observaciones no son tan fáciles de detectar visualmente por el problema de la dimensión: en este caso las técnicas de tipo formal que se han desarrollado son muy escasas debido principalmente a que las variables, en general, no cumplen el supuesto de independencia, lo cual no permite elaborar pruebas que presenten una buena potencia. Según Beckman y Cook (1983) los outliers en una muestra univariable se puede considerar como aquellas observaciones que en opinión del investigador se mantienen aparte o alejadas del volumen de los datos, conocidas en la literatura como:”observaciones discordantes”, “contaminantes”, “disidentes”, etc. También se consideran outliers aquellas observaciones que tienen la apariencia de desviarse notablemente de los otros miembros de la muestra en la cual ocurren. Las observaciones outliers son estudiadas para la detección de un fenómeno alternativo específico. Según Beckman y Cook (1983) los outliers pueden ser de distintos tipos: Observación discordante es aquella observación que parece sorprendente o discrepante para el investigador: Observación contaminante es aquella que no proviene de la población en estudio. Sino de otra población: Observación influyente es aquella que al ser excluida del análisis de datos, altera sustancialmente rasgos importantes de dicho análisis. En la detección de outliers se presentan varios problemas, entre otros: Una observación puede ser identificada como un outlier por un método dado y no por otro: Puede ser un outlier en un modelo y no en otro, y finalmente, en el caso multivariable, puede ser un outlier en un espacio p-dimensional y no lo es necesariamente en un subespacio dado. Por lo expuesto anteriormente, se hace necesario e importante, además de estudiar y revisar las técnicas que han sido propuestas. Explorar una nueva metodología de tipo informal. Que pueda detectar outliers en el caso de datos multivariables utilizando el enfoque por “Projection Pursuit”, buscando índices apropiados que permitan evaluar las proyecciones de los datos en diferentes subespacios. Los outliers que detectaremos son del tipo de observaciones discordantes. Adicionalmente, se desea evaluar la eficiencia de esta metodología comparándola con la técnica de componentes principales.
publishDate 1999
dc.date.issued.spa.fl_str_mv 1999
dc.date.accessioned.spa.fl_str_mv 2019-06-24T13:04:43Z
dc.date.available.spa.fl_str_mv 2019-06-24T13:04:43Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/3081
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/1495/
url https://repositorio.unal.edu.co/handle/unal/3081
http://bdigital.unal.edu.co/1495/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de Estadística Estadística
Estadística
dc.relation.references.spa.fl_str_mv López Ríos, Victor Ignacio (1999) Detección de outliers multivariables mediante projection pursuit. Maestría thesis, Universidad Nacional de Colombia Sede Medellín.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/3081/1/15383124.1999.pdf
https://repositorio.unal.edu.co/bitstream/unal/3081/2/15383124.1999.pdf.jpg
bitstream.checksum.fl_str_mv b4cb358df3971f575cabfbe6b39a86a0
e19ee129137e1ea56a8bd2380d365ec4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089465768968192
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Correa Morales, Juan Carlos (Thesis advisor)5ce5bfe7-ef62-414b-a49c-747c8fecaff1-1López Ríos, Victor Ignacioa8b1eeb3-b1c3-4c21-b0ae-8d330f1ec33e3002019-06-24T13:04:43Z2019-06-24T13:04:43Z1999https://repositorio.unal.edu.co/handle/unal/3081http://bdigital.unal.edu.co/1495/Tanto en inferencia estadística como en el análisis de datos experimentales, ya sean univariables o multivariables. Es esencial evaluar la calidad de los datos sujetos a estudio. Es por ello que se hace necesario explorar y construir métodos que ayuden a la detección de ciertas observaciones que puedan afectar las medidas (correlaciones) en el caso multivariable. Estas observaciones se conocen en la literatura estadística como “outliers”. En el caso de univarible se han desarrollado muchos trabajos tanto informales como de tipo formal. Una extensa revisión bibliografía es presentada por Barnett y Lewis (1994) y por Beckman y Cook (1983). En el caso multivariable, la situación es diferente, la detección de outliers requiere de una exploración mucho mas detallada ya que estas observaciones no son tan fáciles de detectar visualmente por el problema de la dimensión: en este caso las técnicas de tipo formal que se han desarrollado son muy escasas debido principalmente a que las variables, en general, no cumplen el supuesto de independencia, lo cual no permite elaborar pruebas que presenten una buena potencia. Según Beckman y Cook (1983) los outliers en una muestra univariable se puede considerar como aquellas observaciones que en opinión del investigador se mantienen aparte o alejadas del volumen de los datos, conocidas en la literatura como:”observaciones discordantes”, “contaminantes”, “disidentes”, etc. También se consideran outliers aquellas observaciones que tienen la apariencia de desviarse notablemente de los otros miembros de la muestra en la cual ocurren. Las observaciones outliers son estudiadas para la detección de un fenómeno alternativo específico. Según Beckman y Cook (1983) los outliers pueden ser de distintos tipos: Observación discordante es aquella observación que parece sorprendente o discrepante para el investigador: Observación contaminante es aquella que no proviene de la población en estudio. Sino de otra población: Observación influyente es aquella que al ser excluida del análisis de datos, altera sustancialmente rasgos importantes de dicho análisis. En la detección de outliers se presentan varios problemas, entre otros: Una observación puede ser identificada como un outlier por un método dado y no por otro: Puede ser un outlier en un modelo y no en otro, y finalmente, en el caso multivariable, puede ser un outlier en un espacio p-dimensional y no lo es necesariamente en un subespacio dado. Por lo expuesto anteriormente, se hace necesario e importante, además de estudiar y revisar las técnicas que han sido propuestas. Explorar una nueva metodología de tipo informal. Que pueda detectar outliers en el caso de datos multivariables utilizando el enfoque por “Projection Pursuit”, buscando índices apropiados que permitan evaluar las proyecciones de los datos en diferentes subespacios. Los outliers que detectaremos son del tipo de observaciones discordantes. Adicionalmente, se desea evaluar la eficiencia de esta metodología comparándola con la técnica de componentes principales.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de Estadística EstadísticaEstadísticaLópez Ríos, Victor Ignacio (1999) Detección de outliers multivariables mediante projection pursuit. Maestría thesis, Universidad Nacional de Colombia Sede Medellín.51 Matemáticas / MathematicsEstadísticaAnálisis multivarianteCorrelación (Estadística)SimulaciónDetección de outliers multivariables mediante projection pursuitTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL15383124.1999.pdfTesis de Maestría en Ciencias - Estadísticaapplication/pdf6590650https://repositorio.unal.edu.co/bitstream/unal/3081/1/15383124.1999.pdfb4cb358df3971f575cabfbe6b39a86a0MD51THUMBNAIL15383124.1999.pdf.jpg15383124.1999.pdf.jpgGenerated Thumbnailimage/jpeg2635https://repositorio.unal.edu.co/bitstream/unal/3081/2/15383124.1999.pdf.jpge19ee129137e1ea56a8bd2380d365ec4MD52unal/3081oai:repositorio.unal.edu.co:unal/30812023-08-21 23:08:28.207Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co