Está en la página 1de 26

Existe correlación entre dos

variables están relacionados


con la otra de alguna
manera
Se realiza mediante el Diagrama
de Dispersión
Se representa gráficamente la
relación entre dos variables
Se pueden tener alguno de estos
casos:
40 40

30 30

20 20

10 10

0 0
0 10 20 30 0 10 20 30

Correlación lineal positiva Correlación lineal negativa


100
40
80

60 30

40 20
20
10
0
0 10 20 30 0
0 10 20 30

Correlación no lineal No existe Correlación


Mide la fuerza de la relación lineal entre
los valores cuantitativos apareados x e y
en una muestra.
Coeficiente de Correlación de Pearson
Se calcula mediante:
n xy   x y
r
n x   x n y
2 2 2
  y 
2

La muestra de datos pareados es
una muestra aleatoria de datos
cuantitativos
El diagrama de dispersión deben
confirmar que los puntos se
acercan a una línea recta.
Es necesario eliminar cualquier
valor externo, si se sabe que se
trata de un error.
Correlación Correlación
negativa positiva
perfecta Ninguna perfecta
correlación
Moderada
Moderada correlación
correlación positiva
negativa
Fuerte Débil Débil Fuerte
correlación correlación correlación correlación
negativa negativa positiva positiva

-1 - 0.5 0 0.5 1
1. El valor de r está siempre entre -1 y +1,
inclusive. Es decir ,
-1 ≤ r ≤1
2. El valor de r no cambia si todos los valores de
cualquier variable se convierten a una escala
diferente.
3. El valor de r no se afecta por la elección de x
o y.
4. r mide la fuerza de relación lineal. No se
diseñó para medir la relación que no es lineal
La proporción de la variación de y que esta
explicada, o se debe, por la relación lineal
entre x e y.
Se calcula y representa mediante :

2
r
Concluir que la correlación implica
causalidad

Datos basados en promedios

Propiedad de la linealidad
HIPÓTESIS

H0 :   0 No existe correlación lineal entre las variables

H1 :   0 Existe correlación lineal entre las variables

ESTADÍSTICO DE PRUEBA
Método 1: Utilice el estadístico de prueba r n2
t
Valores críticos: Tabla A-3 con n-2 g.l. 1 r 2
Conclusión: si |t| >el valor crítico de la tabla rechace Ho

Método 2: Utilice la Tabla A-6 de valores críticos de r


HIPÓTESIS

H0 :   0 No existe correlación lineal entre las variables

H1 :   0 Existe correlación lineal entre las variables

ESTADÍSTICO DE PRUEBA
Estadístico de prueba: r
Valor crítico: Tabla A-6 de valores críticos de r
Conclusión: Si |r| > valor crítico de la tabla, rechace Ho
 A continuación se presentan los pesos (en
libras) y las cantidades de combustible
consumidas en carretera (en mi/gal) de
automóviles elegidos al azar. ¿Existe una
correlación lineal entre el peso y el consumo
de combustible en carretera? ¿Qué sugiere el
resultado sobre un programa nacional para
reducir el consumo de petróleo importado?
El análisis de regresión y correlación
reconoce que puede existir relación entre dos
variables
Esto es una variable depende de otra
variable.
Denotando como:

Y  f (X )
La muestra de datos pareados es
una muestra aleatoria de datos
cuantitativos
El diagrama de dispersión deben
confirmar que los puntos se
acercan a una línea recta.
Es necesario eliminar cualquier
valor externo, si se sabe que se
trata de un error.
 Para cada valor fijo de x, los valores
correspondientes de y tienen
distribución normal
 Para los distintos valores fijos de x, las
distribuciones de los valores
correspondientes de y tienen la misma
varianza
 Para los distintos valores fijos de x, las
distribuciones de los valores
correspondientes de y tienen medias
que se ubican en la misma línea recta.
 Los valores de y son independientes.
VARIABLE DEPENDIENTE (y) : Está en
función de la variable x
VARIABLE INDEPENDIENTE (x) : Afecta o
modifica a otra variable (y), llamada variable
de predicción.
Ejemplo:
Las ventas (y) depende del precio (x)
Técnica para permiten encontrar un modelo
matemático que relaciona a dos variables
Este modelo recibe el nombre de Ecuación de
Regresión
y  a  bx y  b0  b1 x
40

30

y   0  1 x
20

10

0
0 10 20 30
Método de mínimos cuadrados para cálculo de b1
y b2

b1  n xy  x  y

 y
b
 x
n  x   x  b0
2 2
1
n n
 Si no existe correlación lineal, el
mejor valor predicho de y es y
promedio
 Si existe correlación lineal, el mejor
valor predicho de y se calcula
sustituyendo el valor de x en la
ecuación de regresión
 Si no existe una correlación lineal, no
utilice la ecuación de regresión para
hacer predicciones.
 Permanezca en el ámbitos de los datos
muestrales disponibles
 Una ecuación de regresión que está
basada en datos antiguos no
necesariamente es válida ahora
 No haga predicciones acerca de una
población distinta de la población de
donde se obtuvieron los datos muestrales.
 Cambio marginal (b1): Es la cantidad que y
cambia cuando la variable x cambia
exactamente una unidad.
 Valores extremos: es un punto que aparece
muy lejos de los otros puntos de datos.
 Puntos de influencia: Son los puntos que
afectan fuertemente la gráfica de la recta de
regresión.
En una medida de dispersión de los
valores observados alrededor de la línea
de regresión

s y,x   ( y  y est ) 2

n2
Estima el valor medio de y para una x dada

1 ( x  x) 2
yest  t / 2;n  2 s yx 
n
 x 2

(  x ) 2

n
Estima el rango de valores de y para una x
dada

1 ( x  x)2
yest  t / 2;n 2 s yx 1 
n ( x ) 2

x  n
2

También podría gustarte