Sobre El Uso Adecuado Del Coeficiente De Correlación De Pearson: Definición, Propiedades Y Suposiciones

El coeficiente de correlación de Pearson es una medida considerablemente utilizada en diversas áreas del quehacer científico, desde estudios técnicos, econométricos o de ingeniería; hasta investigaciones relacionadas con las ciencias sociales, del comportamiento o de la salud. Es precisamente esta e...

Full description

Autores:
Hernández Lalinde, Juan Diego
Espinosa Castro, Jhon Franklin
Peñaloza Tarazona, Mariana Elena
Fernández González, Johel Enrique
Chacón Rangel, José Gerardo
Toloza Sierra, Cristian Andrés
Arenas Torrado, Marlly Karina
Carrillo Sierra, Sandra Milena
Bermúdez Pirela, Valmore José
Tipo de recurso:
Fecha de publicación:
2018
Institución:
Universidad Simón Bolívar
Repositorio:
Repositorio Digital USB
Idioma:
spa
OAI Identifier:
oai:bonga.unisimon.edu.co:20.500.12442/2469
Acceso en línea:
http://hdl.handle.net/20.500.12442/2469
Palabra clave:
Coeficiente
Correlación
Supuestos
Normalidad bivariada
Datos atípicos multivariados
Coefficient
Correlation
Pearson
Assumptions
Bivariate normality
Multivariate outliers
Rights
License
Licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional
Description
Summary:El coeficiente de correlación de Pearson es una medida considerablemente utilizada en diversas áreas del quehacer científico, desde estudios técnicos, econométricos o de ingeniería; hasta investigaciones relacionadas con las ciencias sociales, del comportamiento o de la salud. Es precisamente esta extensa y profusa divulgación una de las razones que explicaría el uso indebido que se le da a esta herramienta estadística, especialmente en aquellos escenarios en los que debe ser interpretada correctamente o en los que se tienen que comprobar las suposiciones matemáticas que la sustentan. Un ejemplo de esto se halla cuando se asume que la correlación implica causalidad, confusión en la que se incurre con frecuencia y en la que se ven involucrados, tanto investigadores noveles, como algunos más experimentados. Pero tal vez el foco de mayores errores se encuentre al momento de comprobar premisas como la de la normalidad, siendo que esta se verifica únicamente a nivel univariado y se omite su revisión bivariada, quizás por desconocimiento o porque exige la utilización de técnicas más complejas. Situación similar se observa cuando se intentan detectar datos atípicos. En este caso, lo común es que se empleen diagramas de caja y bigotes para identificar valores extremos en cada variable, cuando lo apropiado sería abordar esta tarea con procedimientos que cuantifiquen la distancia que separa a dicha observación del centro de gravedad de los datos, pero de manera simultánea y tomando en cuenta todos los componentes del espacio vectorial en que se encuentra. En tal sentido, se propone la presente revisión como aporte para esclarecer estas dudas y como guía metodológica para orientar en la verificación de tales supuestos, abordando el aspecto matemático de manera general, pero enfatizando en las alternativas de que dispone el investigador para acometer debidamente este tipo de análisis.