Está en la página 1de 9

Estadstica para investigadores:

todo lo que siempre quiso saber


y nunca se atrevi a preguntar

Mdulo 3. Anlisis de la relacin entre


dos variables cuantitativas:
Correlacin y Regresin

M Purificacin Galindo Villardn


M Purificacin Vicente Galindo
Universidad de Salamanca
Departamento de Estadstica
Mdulo 3. Anlisis de la relacin entre dos variables cuantitativas: Correlacin y
regresin

ndice
Pregunta 1. ..................................................................................................... 4
Pregunta 2. ..................................................................................................... 4
Pregunta 3. ..................................................................................................... 4
Pregunta 4. ..................................................................................................... 5
Pregunta 5. ..................................................................................................... 5
Pregunta 6. ..................................................................................................... 6
Pregunta 7. ..................................................................................................... 6
Pregunta 8. ..................................................................................................... 7
Pregunta 9. ..................................................................................................... 7
Pregunta 10. ................................................................................................... 7

Mdulo 3. Anlisis de la relacin entre dos variables cuantitativas: Correlacin y regresin

Respuestas a las preguntas ms


frecuentes con las que se
encuentra un investigador

Mdulo 3. Anlisis de la relacin entre dos variables cuantitativas: Correlacin y regresin

Pregunta 1.

Un coeficiente de correlacin significativo implica que entre las variables X e


Y existe una relacin causa efecto?
No, en absoluto. Indica simplemente que X e Y covaran pero puede ser que
covarien simplemente por efecto de una tercera. Por ejemplo, el nmero de canas
y la presin arterial covaran por efecto de una tercera variable que es la edad.

Pregunta 2.

Un coeficiente de correlacin no significativo implica que entre las variables


no existe una relacin causa efecto?
No necesariamente. Si no estn relacionadas es evidente que una no es causa de la
otra, pero puede ocurrir que exista relacin y no la detectemos en el estudio por
falta de informacin, por ejemplo, por un bajo tamao muestral.

Pregunta 3.
Un coeficiente de correlacin cero (o prximo a cero) implica que las variables
X e Y son independientes?
No. Lo que es cierto es que cuando dos variables son independientes el coeficiente
de correlacin de Pearson es cero, pero puede ser cero y las variables estar
relacionadas mediante una relacin parablica, por ejemplo.

Mdulo 3. Anlisis de la relacin entre dos variables cuantitativas: Correlacin y regresin

Pregunta 4.
Podemos fiarnos de una publicacin en la que aparece una recta de regresin
y no incluye ni el coeficiente de correlacin ni el coeficiente de
determinacin?
Podemos fiarnos, pero no es recomendable. Ya que no sabemos el poder
explicativo del modelo; es decir, qu porcentaje de puntos de la nube vienen bien
representados por el modelo. Sera como escribir la media y no acompaarla de
una medida de dispersin.

Pregunta 5.

Un modelo de regresin lineal, con alto valor explicativo (R2 prximo al 100%),
es un buen modelo para predecir?
Lo contrario si es cierto, si no tienen alto poder explicativo no es bueno para
predecir, pero puede tener alto poder explicativo y no ser bueno para predecir ya
que el modelo se estudia en un rango de valores y fuera de ese rango la relacin
puede ser diferente. Por ejemplo, para unas dosis determinadas, puede existir un
modelo lineal que explique adecuadamente la relacin entre la cantidad de un
nutriente y el crecimiento de una planta. Pero si aumentamos indefinidamente la
dosis, la planta no crecera hasta el infinito (como predeciramos con el modelo
lineal) sino que puede incluso morir.

Mdulo 3. Anlisis de la relacin entre dos variables cuantitativas: Correlacin y regresin

Pregunta 6.
Por qu se usa, en las publicaciones, el coeficiente de correlacin en vez de la
covarianza, cuando en los textos de estadstica siempre se explica primero la
covarianza?
La covarianza es el estadstico que captura realmente la informacin sobre si las
variables estn o no, relacionadas linealmente. Pero, no est acotada y arrastra las
unidades de las dos variables, lo que hace difcil su interpretacin. Por el
contrario, el Coeficiente de Correlacin de Pearson recoge toda la informacin
capturada por la covarianza, y adems es adimensional y est acotado. Todo esto
facilita considerablemente la interpretacin y es la razn por la que se utiliza
mucho ms en las publicaciones. Sin embargo, a nivel didctico no tiene sentido
explicar el coeficiente de correlacin sin haber explicado la covarianza.

Pregunta 7.
Es lo mismo el coeficiente de correlacin que el coeficiente de regresin?
No. Ambos se calculan a partir de la covarianza y tienen por tanto, el mismo signo,
pero transmiten informacin muy diferente.
El coeficiente de correlacin se calcula como la covarianza partida por el producto
de las desviaciones tpicas de las dos variables y se utiliza para decidir si hay
relacin lineal entre las variables, de qu tipo es (directa o inversa)

cuantificarla.
El coeficiente de regresin se calcula como la covarianza partida por la varianza de
la variable independiente y se interpreta como el incremento (decremento) en la
variable respuesta por cada incremento unitario en la variable independiente.

Mdulo 3. Anlisis de la relacin entre dos variables cuantitativas: Correlacin y regresin

Para que coincidieran tendra que ocurrir que la desviacin tpica de la variable
independiente y la desviacin tpica de la dependiente coincidieran, cosa muy
poco probable.

Pregunta 8.
Una nube de puntos muy dispersa puede llevar asociado un coeficiente de
correlacin significativo?
S. Un coeficiente de correlacin significativo slo dice que existen indicios
suficientes para suponer que no son independientes, pero eso no equivale a
afirmar que ser posible encontrar un buen modelo que nos permita estimar la
variable respuesta a partir del conocimiento de la variable independiente.
Pregunta 9.

Puede ocurrir que al estudiar la relacin de una variable X1 con una variable Y
resulte significativa, al estudiar la relacin entre X2 e Y, tambin sea
significativa y al estudiar la relacin entre X1 y X2 e Y, alguna de las dos
variables X aparezca como no significativa?
Lamentablemente SI. Si X1 y X2 estn relacionadas entre s, una de las dos (por
ejemplo X2) aparecera como no significativa ya que no aportara informacin
diferente de la ya capturada al estudiar la relacin entre Y y la variable X1.

Pregunta 10.
Puede ocurrir que si las variables explicativas X1 y X2 estn fuertemente
relacionadas entre s, al estudiar el modelo de regresin que relaciona Y con X 1
y con X2 aparezca un signo para el coeficiente de regresin contrario al real?
Mdulo 3. Anlisis de la relacin entre dos variables cuantitativas: Correlacin y regresin

Lamentablemente s. Cuando las variables explicativas estn fuertemente


relacionadas se dice que hay colinealidad. En presencia de colinealidad pueden
aparecer como no significativas variables que s estn realmente relacionadas con
la respuesta y puede ocurrir que el signo que aparezca en el modelo de regresin
sea el contrario al esperado. Cuando esto ocurra lo mejor es contactar con un
especialista estadstico que le ayude en el tratamiento de los datos y le haga un
correcto diagnstico de la colinealidad.

Mdulo 3. Anlisis de la relacin entre dos variables cuantitativas: Correlacin y regresin

Mdulo 3. Anlisis de la relacin entre dos variables cuantitativas: Correlacin y regresin

También podría gustarte