Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(
(
(
(
Donde n es el nmero de observaciones, s
2
F
es la varianza estimada de error de prediccin y
( )
( ) 2
2
=
|
|
.
|
\
|
n
i
i Y Yi
s
3
Donde:
Yi valores reales
i valores estimados por mnimos cuadrados Y
=
=
_
_ _ _ _
El intervalo de confianza al 95 % para la prediccin de Y
F
, es donde
Y
Pred
(t
0.025
)(s
F
)
Donde el valor de t se encuentra en tablas con n-2 grados de libertad, y se emplea al 50% del
valor requerido de confianza por ser una sola cola.
De manera ilustrativa analicemos el siguiente ejemplo:
La siguiente tabla muestra las ventas de cierto producto en millones de pesos, Y, resultante del
empleo de la aplicacin de diferentes cantidades de recursos publicitarios en millones de pesos
por periodo, X, en una empresa en los aos 1981 - 1990:
Ao n Y
i
X
i
1981 1 40 6
1982 2 44 10
1983 3 46 12
1984 4 48 14
1985 5 52 16
1986 6 58 18
1987 7 60 22
1988 8 68 24
1989 9 74 26
1990 10 80 32
Con la utilizacin de calculadora electrnica encontramos que la ecuacin de aproximacin de
mnimos cuadrados que representa los datos anteriores es la siguiente:
Y = (1.659)X + 27.125
4
con un factor de correlacin r = 0.9854 y un factor de determinacin r
2
= 0.9710 97.10%,
(porcentaje de variacin en las ventas determinado por la variable explicatoria gasto
publicitario),es decir, que la ecuacin de regresin explica alrededor del 97% de la variacin
total de las ventas, y el 3% restante se atribuye a factores incluidos en el trmino de error.
Posteriormente se determina el cociente
( )
s
Yi Yi
i
n
2
2
2
=
|
\
|
.
|
|
\
|
.
|
|
= =
|
\
|
.
|
|
\
|
.
|
|
.
.
5
Si proyectamos para 1991 una cantidad de gasto publicitario 35 millones de pesos, cules
sern las ventas esperadas?
( )
s s F
F
2
591 1
1
10
35 18
2
576
946 308 = + +
= =
(
(
(
. . .
Entonces encontramos que:
Y
Pred
= (27.125+1.659(35)) (2.31)(3.08) = 85.197.115 =
78.075<Y
Pred
>92.305 (intervalo de confianza del 95%)
COEFICIENTE DE CORRELACIN:
Ejemplo 1. Prediccin de ventas debidas a publicidad,
Supngase una compaa inici recientemente publicidad con un nuevo medio. El gerente de
marketing a registrado el gasto publicitario semanal (x) y los correspondientes volmenes de
ventas (y). Desea saber cual es el nivel esperado de ventas si la prxima semana se invierte en
publicidad us$ 3,250.00
Gasto Publicitario (x) Ventas Semanales (y)
1,000.00 101,000
1,250.00 126,000
1,500.00 163,000
2,000.00 194,000
2,500.00 209,000
3,250.00 ?
6
En este ejemplo el resultado es 274,517 unidades, con un valor del coeficiente de correlacin
de 0.964.
La correlacin es buena, pero el pequeo nmero puntos usados y la distancia entre 3,250 y
2,500 (ltimo valor registrado), lo convierten en menos significativo.
Significancia del coeficiente de correlacin.
Como se mencion en el ejemplo anterior, se trata de predecir el futuro basado solamente en
cinco puntos del pasado. En general, mientras menos sean los datos analizados, menos
confiable ser la prediccin.
Para saber que tan significativo es el coeficiente de correlacin se puede seguir el siguiente
procedimiento:
1. Determinar el nivel de certeza requerido para el coeficiente de correlacin.
2. Localizar el valor de r obtenido en la tabla siguiente, para el grado de certeza
seleccionado y el nmero de muestras usadas.
3. Si el valor del coeficiente de correlacin calculado es mayor que el valor en tablas,
podemos estar seguros, al nivel de certeza seleccionado, que el valor de r
calculado no es debido solo a la casualidad.
Para el ejemplo anterior, si deseamos un 95% de certeza, con cinco muestra empleadas, el
valor de tablas es 0.878.
El valor calculado es mayor que el de tablas, por lo que podemos asumir. con 95 % de
seguridad, que en realidad los valores analizados tienen una buena correlacin, la cual no es
debida a la casualidad.
Ejemplo 2. Supongamos que el gerente de ventas de una compaa est invirtiendo en una
serie de pruebas para medir el desempeo en ventas, y desea saber que tan correlacionados
estn las calificaciones con el desempeo en el campo.
7
Empleado Calificacin (x) Desempeo (y)
Lane 5 10
Bob 13 30
Britt 8 30
Ralph 10 40
Lana 15 60
Dae 20 50
Dennis 4 20
Patrick 16 60
Kathy 18 50
Kevin 6 20
Para este ejemplo, el valor del coeficiente de correlacin calculado es 0.866, y se considera
bueno (un coeficiente se considera bueno empricamente si se cumple:
(-0.7 s r > 0.7 )
Para determinar que tan significativa es la correlacin entre las calificaciones de la prueba, se
localiza en la tabla la fila correspondiente a 10 muestras, y se busca en ella, el valor de r ms
aproximado al calculado. En este caso 0.866 queda entre 0.765 y 0.872 (en tablas
estadsticas), por lo que podemos decir que tenemos una certeza entre 99 % y 99.99 % de que
la correlacin entre las calificaciones obtenidas en la prueba (por esos vendedores
nicamente), y el desempeo en ventas en campo, es buena y no se debe solo a la casualidad
este resultado.