Documentos de Académico
Documentos de Profesional
Documentos de Cultura
30 30
20 20
10 10
0 0
0 10 20 30 0 10 20 30
60 30
40 20
20
10
0
0 10 20 30 0
0 10 20 30
-1 - 0.5 0 0.5 1
1. El valor de r está siempre entre -1 y +1,
inclusive. Es decir ,
-1 ≤ r ≤1
2. El valor de r no cambia si todos los valores de
cualquier variable se convierten a una escala
diferente.
3. El valor de r no se afecta por la elección de x
o y.
4. r mide la fuerza de relación lineal. No se
diseñó para medir la relación que no es lineal
La proporción de la variación de y que esta
explicada, o se debe, por la relación lineal
entre x e y.
Se calcula y representa mediante :
2
r
Concluir que la correlación implica
causalidad
Propiedad de la linealidad
HIPÓTESIS
ESTADÍSTICO DE PRUEBA
Método 1: Utilice el estadístico de prueba r n2
t
Valores críticos: Tabla A-3 con n-2 g.l. 1 r 2
Conclusión: si |t| >el valor crítico de la tabla rechace Ho
ESTADÍSTICO DE PRUEBA
Estadístico de prueba: r
Valor crítico: Tabla A-6 de valores críticos de r
Conclusión: Si |r| > valor crítico de la tabla, rechace Ho
A continuación se presentan los pesos (en
libras) y las cantidades de combustible
consumidas en carretera (en mi/gal) de
automóviles elegidos al azar. ¿Existe una
correlación lineal entre el peso y el consumo
de combustible en carretera? ¿Qué sugiere el
resultado sobre un programa nacional para
reducir el consumo de petróleo importado?
El análisis de regresión y correlación
reconoce que puede existir relación entre dos
variables
Esto es una variable depende de otra
variable.
Denotando como:
Y f (X )
La muestra de datos pareados es
una muestra aleatoria de datos
cuantitativos
El diagrama de dispersión deben
confirmar que los puntos se
acercan a una línea recta.
Es necesario eliminar cualquier
valor externo, si se sabe que se
trata de un error.
Para cada valor fijo de x, los valores
correspondientes de y tienen
distribución normal
Para los distintos valores fijos de x, las
distribuciones de los valores
correspondientes de y tienen la misma
varianza
Para los distintos valores fijos de x, las
distribuciones de los valores
correspondientes de y tienen medias
que se ubican en la misma línea recta.
Los valores de y son independientes.
VARIABLE DEPENDIENTE (y) : Está en
función de la variable x
VARIABLE INDEPENDIENTE (x) : Afecta o
modifica a otra variable (y), llamada variable
de predicción.
Ejemplo:
Las ventas (y) depende del precio (x)
Técnica para permiten encontrar un modelo
matemático que relaciona a dos variables
Este modelo recibe el nombre de Ecuación de
Regresión
y a bx y b0 b1 x
40
30
y 0 1 x
20
10
0
0 10 20 30
Método de mínimos cuadrados para cálculo de b1
y b2
b1 n xy x y
y
b
x
n x x b0
2 2
1
n n
Si no existe correlación lineal, el
mejor valor predicho de y es y
promedio
Si existe correlación lineal, el mejor
valor predicho de y se calcula
sustituyendo el valor de x en la
ecuación de regresión
Si no existe una correlación lineal, no
utilice la ecuación de regresión para
hacer predicciones.
Permanezca en el ámbitos de los datos
muestrales disponibles
Una ecuación de regresión que está
basada en datos antiguos no
necesariamente es válida ahora
No haga predicciones acerca de una
población distinta de la población de
donde se obtuvieron los datos muestrales.
Cambio marginal (b1): Es la cantidad que y
cambia cuando la variable x cambia
exactamente una unidad.
Valores extremos: es un punto que aparece
muy lejos de los otros puntos de datos.
Puntos de influencia: Son los puntos que
afectan fuertemente la gráfica de la recta de
regresión.
En una medida de dispersión de los
valores observados alrededor de la línea
de regresión
s y,x ( y y est ) 2
n2
Estima el valor medio de y para una x dada
1 ( x x) 2
yest t / 2;n 2 s yx
n
x 2
( x ) 2
n
Estima el rango de valores de y para una x
dada
1 ( x x)2
yest t / 2;n 2 s yx 1
n ( x ) 2
x n
2