Está en la página 1de 22

Este documento es de distribucin gratuita

y llega gracias a

Ciencia Matemtica
www.cienciamatematica.com
El mayor portal de recursos educativos a tu servicio!
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 1 M. en C. Jos Luis Hernndez Gonzlez







INSTITUTO TECNOLGICO DE APIZACO





DEPARTAMENTO DE CIENCIAS BSICAS
www.itapizaco.edu.mx/~cbasicas


ESTADSTICA ADMINISTRATIVA II
(Licenciatura en administracin)





M. en C. JOS LUIS HERNNDEZ GONZLEZ
www.itapizaco.edu.mx/~joseluis (~ alt 126)

Enviar las tareas al correo: tareasjlhg@yahoo.com



Alum.:____________________________________________ No. Lista: _________



Apizaco Tlax., Agosto/Diciembre 2007



Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 2 M. en C. Jos Luis Hernndez Gonzlez
ESTADSTICA ADMINISTRATIVA II

(Licenciatura en administracin)



OBJETIVO GENERAL DEL CURSO.

Analizar y aplicar conceptos y tcnicas de la probabilidad y estadstica descriptiva e inferencial en
la solucin de problemas en reas de su competencia.

1 Pruebas de Hiptesis
1.1 Hiptesis estadsticas. Conceptos generales
1.2 Errores tipo I y II
1.3 Pruebas unilaterales y bilaterales
1.4 Prueba de una hiptesis: referente a la media con varianza Desconocida utilizando la
distribucin normal y t student
1.5 Dos muestras: pruebas sobre dos medias utilizando la distribucin Normal y t student.
1.6 Una muestra: prueba sobre una sola proporcin
1.7 Dos muestras: prueba sobre dos proporciones
1.8 Dos muestras: pruebas pareadas

2 Pruebas de la bondad del ajuste y anlisis de varianza
2.1 Anlisis Ji-Cuadrada
2.1.1 Prueba de independencia
2.1.2 Prueba de la bondad del ajuste
2.1.3 Tablas de contingencia
2.2 Anlisis de varianza
2.2.1 Inferencia sobre una varianza de poblacin (Anova).
2.2.2 Inferencia sobre la varianza de dos poblaciones (Anova).
2.3 Paquete computacional

3 Anlisis de regresin, correlacin lineal simple y mltiple
3.1 Estimacin mediante la lnea de regresin
3.1.1 Diagrama de dispersin
3.1.2 Mtodo de mnimos cuadrados
3.1.3 Interpretacin del error estndar de la estimacin
3.1.4 Intervalos de prediccin aproximados
3.1.5 Anlisis de correlacin
3.1.6 Paquete computacional para la solucin de problemas
3.1.7 Regresin mltiple y anlisis de correlacin
3.1.8 Usos de variables ficticias
3.1.9 Residuales y grficas de residuales
3.1.10 Interpretacin del intervalo de confianza.
3.1.11 Uso del coeficiente de determinacin mltiple
3.1.12 Paquete computacional para la solucin de problemas.
www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 3 M. en C. Jos Luis Hernndez Gonzlez
4 Series de tiempo
4.1 Modelo clsico de series de tiempo
4.2 Anlisis de tendencia
4.3 Anlisis de variaciones cclicas
4.4 Medicin de variaciones estacionales
4.5 Aplicacin de ajustes estacionales
4.6 Pronsticos basados en factores de tendencia y estacionales
4.7 Pronsticos, ciclos e indicadores econmicos
4.8 Promedios mviles
4.9 Suavizacin exponencial como pronstico
4.10 Aplicaciones del paquete computacional

5 Estadstica no paramtrica.
5.1 Escala de medicin
5.2 Mtodos estadsticos contra no paramtricos
5.3 Prueba de corridas para aleatoriedad
5.4 Una muestra: prueba de signos
5.5 Una muestra: prueba de Wilcoxon
5.6 Dos muestras: prueba de Mann-Whitney
5.7 Observaciones pareadas: prueba de signos
5.8 Observaciones pareadas prueba de Wilcoxon
5.9 Varias muestras independientes: prueba de Kruskal-Wallis
5.10 Aplicaciones del paquete computacional
www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 6 M. en C. Jos Luis Hernndez Gonzlez


PRUEBAS DE HIPTESIS.


Dentro de la inferencia estadstica se encuentra la prueba de hiptesis, cuyo objetivo es
probar o comprobar si la afirmacin que se hace sobre un parmetro poblacional basado en
conclusiones obtenidas de una muestra es correcta o incorrecta.

Hiptesis estadstica.

Es una proposicin o suposicin que se hace sobre los parmetros de una distribucin de
probabilidad de una variable aleatoria. Dicha hiptesis puede ser verdadera o falsa, por lo que se
puede aceptar o rechazar.

Prueba de hiptesis estadstica.

Es el procedimiento empleado para decidir si se acepta o se rechaza por su veracidad o
falsedad, una hiptesis estadstica tambin se le conoce como ensayos de significacin, reglas de
decisin contraste de hiptesis. Su objetivo es evaluar proposiciones o afirmaciones que se
hacen acerca de los parmetros poblacionales basados en estadsticos muestrales con un grado o
nivel de significancia determinado.

Hiptesis nula e hiptesis alternativa.

En una prueba de hiptesis de significacin se plantean dos tipos de hiptesis excluyentes,
llamadas hiptesis nula e hiptesis alternativa.
La hiptesis nula expresa que una proposicin es verdadera, mientras que la hiptesis
alternativa afirma que es falsa viceversa.

H
o
= hiptesis nula H
1
= hiptesis alternativa

Ejemplos:

H
o
= 1.68 H
1
1.68
H
1
< 1.68
H
1
> 1.68


H
o
= 4200 H
1
> 4200
H
1
< 4200
H
1
4200


www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 7 M. en C. Jos Luis Hernndez Gonzlez
Errores tipo I y tipo II.

En el proceso de emplear una muestra para formar una decisin poblacional en una prueba de
hiptesis, podemos cometer dos equivocaciones, al rechazar una hiptesis verdadera o al aceptar una
hiptesis falsa; estas equivocaciones se conocen como:

a) Error tipo I. Se comete cuando se rechaza una hiptesis que por ser
verdadera debera ser aceptada.

b) Error tipo II. Se comete cuando se acepta una hiptesis que por ser
falsa debera ser rechazada.

Buen estudiante Mal estudiante
Aprobarlo Decisin correcta Error tipo II
Repobarlo Error tipo I Decisin correcta


Nivel de significancia y nivel de confianza.

El nivel de significancia se refiere a la probabilidad de cometer error tipo I, es decir,
rechazar una hiptesis verdadera.

El nivel de confianza se refiere a la probabilidad 1- de aceptar una hiptesis verdadera.

H
0
verdadera H
1
falsa
Se acepta Ho Decisin correcta (1 ) Error tipo II ()
Se rechaza Ho Error tipo I () Decisin correcta (1 )

Procedimiento para realizar una prueba de hiptesis.

1.- Del fenmeno estadstico a probar. Se establecen las hiptesis nula H
o
, y la hiptesis alternativa
H
1
.

2.- Se especifica la probabilidad del error tipo I () como nivel de significancia y 1 como nivel
de confianza.

3.- Se selecciona el tamao de la muestra, la funcin de distribucin de probabilidad y el estadstico
muestral que sirva de base para la regla de decisin conocido como estadstico de prueba.

4.- Se determinan los valores crticos que limita la regin de aceptacin de la regin de rechazo (que
depender del valor de y de la hiptesis alternativa).

www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 8 M. en C. Jos Luis Hernndez Gonzlez
5.- Si el valor del estadstico muestral cae dentro de la regin de rechazo, rechazamos H
o
, debido a
que la probabilidad de obtener ese valor del estadstico muestral cuando H
o
es cierta o verdadera, es
tan pequeo que no debe atribuirse a errores de muestreo, lo que nos conduce a deducir que H
o
es
falsa.

6.- Dar conclusin acerca del problema y/o formar una decisin.

Hiptesis unilateral y bilateral.

Al realizar una prueba de hiptesis nuestro inters puede estar en el valor extremo de un solo
lado de la distribucin, o en ambos lados. En el primer casi, las pruebas se denominan unilaterales o
de una cola; en el segundo caso se conoce como bilaterales o de dos colas.

En los ensayos unilaterales la regin de rechazo es nica a un lado de la distribucin con un
rea determinada por el valor de .

En las bilaterales la regin de rechazo el rea se determina dividiendo el nivel de
significancia en dos partes iguales.

BILATERAL










UNILATERAL >







UNILATERAL <







Zona de aceptacin Zona de rechazo
1

Zona de aceptacin Zona de rechazo
1

Zona de aceptacin
Zona de rechazo
/2 1 /2
Zona de rechazo
www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 9 M. en C. Jos Luis Hernndez Gonzlez

H
0
Estadstico de prueba
Distribucin normal
=
0

n
x
= z



Distribucin t
=
0

n
s
x
= t

;v = n 1
Distribucin normal
1 2 = d
0

1
y
2
conocidas
2
2
2
1
2
1
0
2 1
n n
d ) x x (
z


=
Distribucin t
1 2 = d
0

1
=
2
desconocidas

2 1
p
0
2 1
n
1
n
1
s
d ) x x (
t
+

= ;
2 n n
s ) 1 n ( s ) 1 n (
s
2 1
2
2 2
2
1 1 2
p
+
+
=
Distribucin t
1 2 = d
0

1

2
desconocidas

2
2
2
1
2
1
0
2 1
n
s
n
s
d ) x x (
t
+

= ;
1 n
n
s
1 n
n
s
n
s
n
s
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1

|
|

\
|
+

|
|

\
|
|
|

\
|
+
= v
Distribucin normal
p = p
0

) p 1 ( np
np x
z
0 0
0

=
Distribucin normal
p
1
= p
2

|
|

\
|
+

=
2 1
2 1
n
1
n
1
q p
) p p (
z ;
2 1
2 1
n n
x x
p
+
+
=
Distribucin
2

=
0
2
2
2
s ) 1 n (

=
Distribucin F

1
=
2
2
2
2
1
s
s
f =


www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 10 M. en C. Jos Luis Hernndez Gonzlez
ANLISIS DE REGRESIN E INTERPOLACIN

Las funciones que representan un conjunto de datos pueden ser o no polinomiales.

Los mtodos ms utilizados para ajustar curvas a un conjunto de puntos son:

a) Interpolacin polinomial. Consiste en encontrar una funcin que pase exactamente a travs de
cada uno de los puntos.

b) Anlisis de regresin. Consiste en encontrar una funcin que se ajuste a los puntos pero no
necesariamente pase a travs de ellos.


a) b)

ANLISIS DE REGRESIN Y CORRELACIN

El anlisis de regresin trata de establecer una relacin funcional entre variables y proporciona un
mecanismo de prediccin o pronostico y en realidad lo que se requiere es estimar:

x
x | y
+ =


Las relaciones que se pueden establecer dependiendo del nmero de variables independientes x son:

Anlisis de regresin simple. Se establece cuando la variable dependiente y esta en funcin de una
nica variable independiente x.
y = f(x)

Anlisis de regresin mltiple. Se establece cuando la variable dependiente y, se determinan o esta
en funcin de ms de una variable dependiente x.

y = f(x
1
, x
2
, ..., x
n
)

Para el caso de regresin lineal simple tenemos que

bx a Y

+ =

Donde Y

se conoce como y estimada, por simplicidad escribiremos: y = a + bx


www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 11 M. en C. Jos Luis Hernndez Gonzlez
DIAGRAMA DE DISPERSIN

Es la grafica que representa un conjunto de pares ordenados o datos observados y que describe la
relacin que existe entre ellos.







ANLISIS DE REGRESIN

Las funciones matemticas empleadas son las siguientes.

1. Funcin lineal y = a + bx








2. Funcin cuadrtica y = a + bx + cx
2









ANLISIS DE REGRESIN LINEAL

Una vez elegida la funcin matemtica que mejor represente al fenmeno, se requiere de un mtodo
estadstico para estimar los parmetros o valores numricos que ponderen la relacin entre variables,
existen varios mtodos pero el mejor es el de mnimos cuadrados.
El modelo matemtico ms simple de una aproximacin por mnimos cuadrados, es el ajuste de una
lnea recta a un conjunto de pares ordenados (x, y).

y = a + bx + e




x
y
x
y
x
y
e
x
y
www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 12 M. en C. Jos Luis Hernndez Gonzlez
Para obtener la mejor lnea a travs de los datos se debe minimizar la suma de los errores residuales
al cuadrado.
e = y a bx

2
e Sr =

=
2
) bx a y ( Sr


derivando respecto a a y respecto a b

x ) bx a y ( 2
b
Sr
) bx a y ( 2
a
Sr


Hay un mnimo o mximo igualando las dos ecuaciones a cero.



= +
= +
0 yx bx ax
0 y bx a
2

si na a =




= +
= +
xy b x xa
y xb na
2

es decir
(

=
(



xy
y
b
a
x x
x n
2


Resolviendo el sistema de ecuaciones

( )

=
2
2
2
x x n
xy x x y
a

( )

=
2
2
x x n
y x xy n
b




Para la inferencia tambin es necesario calcular:
www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 13 M. en C. Jos Luis Hernndez Gonzlez
( )
n
x
x ) x x ( S
2
2
n
1 i
i xx


= =
=

( )
n
y
y ) y y ( S
2
2
n
1 i
i yy


= =
=

( )( )
n
y x
xy ) y y )( x x ( S
i
n
1 i
i xy


= =
=

xx
xy
S
S
b =

=
2 n
bS S
2 n
) y y (
2 n
SSE
S
xy yy
2
2
Estimador insesgado de la varianza

Ejemplo: Realizar el ajuste lineal para el siguiente conjunto de datos.

x y
-2 13
-1 24
0 39
1 65
2 106


x y x
2
y
2
xy
-2 13 4 169 -26
-1 24 1 576 -24
0 39 0 1521 0
1 65 1 4225 65
2 106 4 11236 212
0 247 10 17727 227

Clculo de los coeficientes a y b.

4 . 49
50
2470
) 0 ( ) 10 )( 5 (
) 227 )( 0 ( ) 10 )( 247 (
a
2
= =

=


www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 14 M. en C. Jos Luis Hernndez Gonzlez
7 . 22
50
1135
) 0 ( ) 10 )( 5 (
) 227 )( 0 ( ) 227 )( 5 (
b
2
= =

=


y = 49.4 + 22.7 x

Calcular el valor de y para cuando x = 1.5.

Cuando x = 1.5

y(2.2) = 49.4 + 22.7(1.5)


y(1.5) = 83.45



ANLISIS DE CORRELACIN

Nos permite determinar cuantitativamente el grado de relacin que existe entre las variables.

Para medir el grado de ajuste de una lnea a un diagrama de dispersin usamos:
a) Coeficiente de determinacin. Representa la proporcin de la variabilidad total de la
muestra aleatoria alrededor de y

Si r
2
= 1 Indica un ajuste perfecto
Si r
2
= 0 Indica un ajuste deficiente o nulo

1 r 0
2


b) Coeficiente de correlacin. Mide la asociacin lineal entre las dos variables.

1 r 1

( )
( ) ( ) ) y y n )( x x n (
y x xy n
r
2
2
2 2
2
2




=
O
www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 15 M. en C. Jos Luis Hernndez Gonzlez
yy yy xx
2
xx
yy
xx 2 2
S
SSR
S S
S
S
S
b r = = =

2
r r =

yy xx
xx
yy
xx
S S
S
S
S
b r = =
( )
( ) ( )
=


=
) 247 ) 17727 )( 5 )(( 0 ) 10 )( 5 ((
) 247 )( 0 ( ) 227 )( 5 (
r
2 2
2
2
0.9326

9657 . 0 9326 . 0 r = =


REGRESIN CUADRTICA

Por medio de mnimos cuadrados podemos ajustar a la ecuacin

y = a + bx + cx
2


Con un procedimiento similar al anlisis de regresin lineal obtenemos los valores de a, b y c.

2
x c an y

+ = ;


+ =
4 2 2
x c x a y x

=
2
x
xy
b ;

Ejemplo: Realizar el ajuste cuadrtico para el siguiente conjunto de datos.

x y x
2
x
4
xy x
2
y
-2 13 4 16 -26 52
-1 24 1 1 -24 24
0 39 0 0 0 0
1 65 1 1 65 65
2 106 4 16 212 424
0 247 10 34 227 565

www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 16 M. en C. Jos Luis Hernndez Gonzlez
(

=
(

(
(



y x
y
c
a
x x
x n
2 4 2
2
;
(

=
(

565
247
c
a
34 10
10 5


a = 39.257; 7 . 22
10
227
b = = ; c = 5.071

y = a + bx + cx
2


y = 39.258 + 22.7x + 5.071x
2

y(1.5) = 39.258 + 22.7(1.5) + 5.071(1.5)
2
= 84.718




INFERENCIAS EN EL ANLISIS DE REGRESIN
Usualmente se realizan inferencias sobre y .
Intervalo de confianza para
Un intervalo de confianza para (1-)100% para el parmetro en la lnea de regresin
x
k / y
+ = es

xx
2 /
xx
2 /
S
S t
b
S
S t
b

+ < <
Donde t
/2
es un valor de la distribucin t con n-2 grados de libertad.

Prueba de hiptesis sobre la pendiente
H
0
: = 0
H
1
: 0

www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 17 M. en C. Jos Luis Hernndez Gonzlez
Se requiere de utilizar la distribucin t con n-2 grados de libertad y establecer una regin crtica
basados en
xx
0
S
s
b
t

=
Procedimiento de anlisis de varianza
Consiste en subdividir la variacin total de la variable dependiente (y) en componentes significativos
que se observan y se tratan de manera sistemtica.
Suponga que se tienen n puntos de datos experimentales en la forma acostumbrada (xi,yi) y que se
estima la lnea de regresin. La varianza (
2
) del conjunto de puntos, se puede calcular con:
S
yy
= bS
xy
+ SSE
La formula alternativa es:

= = =
+ =
n
1 i
n
1 i
2
i
2
i
n
1 i
2
i
) y y ( ) y y ( ) y y (
Con lo que se logra una particin de la suma total de cuadrados de y en dos componentes.
SST = SSR + SSR
SSR es la suma de cuadrados de regresin y refleja la cantidad de variacin en los valores y,
explicados por el modelo.
SSE es la suma de cuadrados del error, que refleja la variacin alrededor de la lnea de regresin.
Bajo la condicin de que = 0, se puede demostrar
2
SSR

y
2
SSE

son valores de variables


2
Independientes con l y n-2 grados de libertad, respectivamente, y por lo tanto se sigue que
2
SST


tambin es un valor de
2
con n 1 grados de libertad. Para realizar esta prueba tenemos:
2
s
SSR
2 n
SSE
l
SSR
f =

=
Se rechaza H
0
al nivel de significancia cuando f > f
(l,n-2)




www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 18 M. en C. Jos Luis Hernndez Gonzlez
El resumen se presenta en una tabla de anlisis de varianza.
ANLISIS DE VARIANZA

Grados de
libertad Suma de cuadrados
Promedio de los
cuadrados F
Valor crtico de
F
Regresin 1
( )
xx
2
xy
S
S
SSR =
SSR
2
s
SSR


Residuos n 2 SSE = SST SSR 2 n
SSE
S
2

=

Total n 1 SST = S
yy


Coeficientes Error tpico Estadstico t Probabilidad Inferior 95%
Intercepcin a
b

Ejemplo: Los siguientes datos se obtuvieron de la medicin de un problema de cada libre bajo
ciertas condiciones de laboratorio. Ajuste un modelo de regresin lineal.

T d
1 6
2 30
3 60
4 91
5 130
6 170
7 200
8 280
9 240
10 340

Los resultados con la herramienta de regresin de Excel son:
Resumen

Estadsticas de la regresin
Coeficiente de correlacin mltiple 0.97895976
Coeficiente de determinacin R^2 0.95836221
R^2 ajustado 0.95241395
Error tpico 22.6605034
Observaciones 9

www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 19 M. en C. Jos Luis Hernndez Gonzlez
ANLISIS DE VARIANZA

Grados de
libertad
Suma de
cuadrados
Promedio de
los
cuadrados F
Valor crtico
de F
Regresin 1 82733.0667 82733.0667 161.116499 4.3581E-06
Residuos 7 3594.48889 513.498413
Total 8 86327.5556


Coeficiente
s Error tpico Estadstico t Probabilidad Inferior 95%
Superior
95%
Intercepcin
-
51.5777778 19.1090143 -2.69913335 0.03067747 -96.7634164 -6.3921392
1 37.1333333 2.9254584 12.6931674 4.3581E-06 30.2157234 44.0509432

Anlisis de los residuales
Resultados de datos de
probabilidad

Observacin
Pronstico
6 Residuos
Residuos
estndares Percentil 6
1 22.6888889 7.31111111 0.34491319 5.55555556 30
2 59.8222222 0.17777778 0.00838695 16.6666667 60
3 96.9555556 -5.95555556 -0.28096272 27.7777778 91
4 134.088889 -4.08888889 -0.19289978 38.8888889 130
5 171.222222 -1.22222222 -0.05766026 50 170
6 208.355556 -8.35555556 -0.3941865 61.1111111 200
7 245.488889 34.5111111 1.62811607 72.2222222 240
8 282.622222 -42.6222222 -2.01077052 83.3333333 280
9 319.755556 20.2444444 0.95506358 94.4444444 340


Curva de regresin ajustada
0
50
100
150
200
250
300
350
400







Grfico de los residuales
-60
-40
-20
0
20
40
0 2 4 6 8 10 12
R
e
s
i
d
u
o
s

Grfico de probabilidad normal
0
100
200
300
400
0 20 40 60 80 100
Muestra percentil
6

www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 20 M. en C. Jos Luis Hernndez Gonzlez
ANLISIS DE REGRESIN MLTIPLE

En la mayora de los problemas se requiere de ms de una variable independiente para un modelo de
regresin, por lo cual se hace necesario considerar que:

y = b
0
+ b
1
x
1
+ b
2
x
2
+ b
3
x
3
+ ... + b
k
x
k


Aplicando mnimos cuadrados podemos calcular los coeficientes

= ) x b ... x b x b y ( Sr
k k 2 2 1 1
2


Derivando respecto a cada uno de los coeficientes, e igualando a cero obtenemos un conjunto de k+1
ecuaciones.

(
(
(
(
(
(

=
(
(
(
(
(
(

(
(
(
(
(
(





y x
y x
y x
y
b
b
b
b
x ... x x x x x
...
x x ... x x x x
x x ... x x x x
x ... x x n
k
2
1
k
2
1
0
2
k 2 k 1 k k
k 2
2
2 1 2 2
k 1 2 1
2
1 1
k 2 1
M M M M M M


Resolviendo el sistema de ecuaciones obtenemos los coeficientes de x.

Ejemplo. Realizar un anlisis de regresin mltiple para los siguientes datos.

y x
1
x
2

90 32 171
70 43 232
90 32 245
102 43 342
96 46 211
77 35 233
51 52 147
88 51 324
82 50 230
94 48 233

Formamos un sistema de 3x3.

www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 21 M. en C. Jos Luis Hernndez Gonzlez
(
(
(

=
(
(
(

(
(
(

203532
36019
840
b
b
b
592638 102707 2368
102707 19196 432
2368 432 10
2
1
0


Resolviendo las ecuaciones tenemos
153 . 0 b
621 . 0 b
655 . 74 b
2
1
0
=
=
=


y = 74.655 0.621x
1
+ 0.153x
2


y(40,150) = 74.655 0.621(40) + 0.153(150) = 72.77


En termino de matrices se puede expresar como
Ab=y
(XX)b =Xy
A=XX
g=Xy
Resolviendo
b = A
1
g
b = (XX)
1
Xy
Inferencia en la regresin lineal mltiple
a) Intervalo de confianza para la respuesta pronosticada
Una de las inferencias ms tiles qu se pueden haces en relacin a la cantidad de la respuesta
pronosticada y0 que corresponde a los valores x
10
, x
20
, , x
k0
es el intervalo de confianza sobre
la respuesta media
0 20 10
,..., , |
k
x x x Y
para el conjunto de condiciones.
0
1
0 2 / 0 x ,..., x , x | Y 0
1
0 2 / 0
x ) X ' X ( ' x s t y x ) X ' X ( ' x s t y
0 k 20 10

+ < <
Donde t
/2
es el valor de la distribucin t con nk1 grados de libertad.
1 k n
SSE
s

=
SSR S SSE
YY
=
O
www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 22 M. en C. Jos Luis Hernndez Gonzlez
( ) ( )
|
|

\
|

|
|

\
|
=

n
Y
' Y ' X '

n
Y
Y ' Y SSE
2 2
donde

=
2
Y Y ' Y
n = nmero de datos de la muestra
k = nmero de variables independientes
La cantidad
0
1
0
x ) X ' X ( ' x s

, se llama error estndar de prediccin y por lo general se calcula
en un programa de computadora.

b) Intervalo de prediccin para una sola respuesta
0
1
0 2 / 0 0 0
1
0 2 / 0
x ) X ' X ( ' x 1 s t y y x ) X ' X ( ' x 1 s t y

+ + < < +
Donde t
/2
es el valor de la distribucin t con nk1 grados de libertad.

c) Prueba de hiptesis sobre los coeficientes individuales
La inclusin de cualquier variable nica en un sistema de regresin aumentar la suma de
cuadrados de regresin y por ello reducir la suma de cuadrados del error. Por ello se debe
decidir si el aumento en la regresin es suficiente para garantizar su uso en el modelo. En
consecuencia el uso de variables sin importar puede reducir la efectividad de la ecuacin de
prediccin al aumentar la varianza de la respuesta estimada.
Se acostumbra probar
H
0
:
j
= B
j0
H
1
:
j
B
j0

Se calcula el estadstico
ij
0 j j
c s
B b
t

=
Donde t
/2
es el valor de la distribucin t con nk1 grados de libertad.
C
jj
es el elemento de la diagonal principal de la matriz inversa (XX)
1
correspondiente a jj

www.cienciamatematica.com
Instituto Tecnolgico de Apizaco Departamento de Ciencias Bsicas
Estadstica II (Lic. en Administracin) pag. 23 M. en C. Jos Luis Hernndez Gonzlez


www.cienciamatematica.com

También podría gustarte